Tour d’horizon des logiciels – archives ouvertes –

L’objectif est de mettre en place un outil permettant de déposer, de stocker, d’indexer et de publier des documents produits par l’Université tels que les thèses…

EPrints est développé par l’Université de Southampton, il est utilisé pour le serveur de thèses du CNRS.

DSpace est développé par les bibliothèques du MIT sous le nom de MIT’s digital repository.

CDSware est développé par le CERN sous le nom de CERN Document Server.

Greenstone est développé par l’Université de Waikato.

i-Tor est développé par le NISIS.

MyCoRe est un projet allemand.

L’Open Society Institute a mis en ligne un guide sur les logiciels de gestion d’archives institutionnelles ; il présente de façon très détaillée les fonctionnalités des 5 outils en open source disponibles actuellement (sauf Greenstone).

Résolveur de liens : les bonnes questions

Le résolveur de liens est un outil qui génére des liens contextuels (rebonds) en se basant sur le protocole standard OpenURL, ces liens sont stockés dans une base de connaissance. Pratiquement, les métadonnées (JCODE, issn, vol, fasc) de la source sont passées en paramètres en respectant l’OpenURL ; le résolveur de liens traite ces éléments en fonction de ses propres spécifications techniques (paramètrages). Un paramètre supplémentaire peut être passé : le DOI, dans ce cas les métadonnées doivent transiter par un serveur DOI (CrossRef) afin de reconstruire l’URL en prenant en compte ce paramètre. La source doit respecter obligatoirement les spécifications OpenURL, les cibles sont conformes ou non à ces spécifications.

Quelle compatibilité OpenURL ? En règle générale, c’est la plus récente donc la plus complexe aussi.

Hébergement de la base de connaissance : local ou centralisé ? L’hébergement centralisé permet un travail collaboratif, mais moins de personnalisation.

Résolveur de lien contextuel ? Les « rebonds » proposés comme services étendus à l’utilisateur peuvent être adaptés en fonction de la source (OPAC, base de données, catalogue collectif…).

Le résolveur de liens gère les droits ? Le résolveur de liens peut s’appuyer sur un annuaire LDAP ou les métadonnées afin de gèrer les droits d’accès aux cibles. On peut également paramètrer le résolveur afin que ses services ne soient activés que lorsque les droits d’accès sont acquis.

Cibles préconfigurées ? Il est souvent préférable de garder la main sur la construction des requêtes vers les cibles…

Le résolveur de liens fonctionne tout seul ? Attention, un travail initial de mise en oeuvre est nécessaire, de même qu’un travail d’actualisation et de mise à jour, sinon le résolveur est « mort ».

One click, two clicks ?
Faire attention à ce que les services proposés par le résolveur soient « directs », ne pas multiplier les clicks pour accéder à la fonctionnalité.

OpenURL et CrossRef

DOI (Digital Object Identifier) : identifiant unique d’une publication

OpenURL : méchanisme pour transporter les métadonnées et les identifiants d’une publication

Résolveur de lien : outil permettant de mettre en place des liens rebonds pour une publication

CrossRef : système mettant en place des liens entre les informations contenues dans les publications et les publications

La recherche documentaire dans un système d’information s’effectue de la façon suivante : Une requête http est lancée sur un serveur DOI, cette information est alors liée aux métadonnées et aux droits associés grâce à l’OpenURL, ces informations peuvent alors être utilisées par un résolveur de liens pour mettre en place les rebonds vers d’autres sources. Les liens éventuels entre les contenus et les publications sont établis à partir des métadonnées et du DOI par CrossRef.

http -> DOI -> OpenURL -> SFX

Recherche fédérée

Objectif
Intégration de sources et de services d’information hétérogènes au sein d’une application afin de procéder en une seule recherche sur une seule interface à l’interrogation de ressources internes et externes soit sur les références, soit sur le texte intégral.

Principe
Les systèmes proposés sont basés sur 2 types de solutions :

  • base XML de métadonnées sur laquelle on exécute les manipulations (moissonnage OAI)
  • connecteur documentaire avec la source

Connecteur documentaire
Système permettant un mapping champ à champ de la source afin de permettre une interrogation à travers une interface unifiée. La qualité du connecteur est fonction du protocole d’interconnexion :

  • Z39.50
    standard de fait, complexe ? mettre en oeuvre, imposant des trous de sécurité sur les systèmes informatiques des établissements (ouverture de ports)La norme ZING (Z39.50 International Next Generation) SRW (Search/Retrieve Web Service) est une norme basée sur les services Web visant à remplacer le protocole Z39.50.
  • SRU/SRW
    protocole plus abouti que Z39.50 mais basé sur le même principe, les requêtes sont formalisées en XML
  • AskOnce
    protocole propriétaire développé par Xerox

Commentaires
La recherche fédérée est une recherche multisources basée sur divers protocoles : Z39.50, SQL, HTTP… De manière simpliste, on pourrait en déduire qu’un outil de recherche intégrée va présenter les mêmes inconvénients que les metamoteurs : une même requête pour toutes les sources sans respecter les spécificités d’interrogation de chaque source ; il n’en est rien. Chaque source est interrogée de manière spécifique grâce aux connecteurs documentaires, ensuite les résultats sont traités pour une exploitation optimale. L’interrogation est au niveau de la référence bibliographique et/ou du texte intégral.

La mise en place d’un outil d’accès intégré présente des avantages multiples :

  • une interface unique pour interroger de multiples sources, on évite ainsi les diverses interfaces propres à chaque fournisseur
  • possibilité de guider les utilisateurs vers des ressources alternatives
  • amélioration de la lisibilité
  • valorisation des achats ou acquisitions
  • intégration de l’Opac local ou des Opacs locaux
  • possibilités de personnalisation de l’interface au niveau de l’utilisateur
  • intégration des contrôles d’accès aux ressources (annuaire LDAP)

DTD et schémas

DTD

  • Docbook DTD
    est une [[DTD]] pour les ouvrages et articles du domaine de l’informatique
  • EAD DTD
    (Encoded Archival Description) est une DTD pour les documents d’archives
  • TEI DTD
    (Text Encoding Initiative) est une DTD pour les ouvrages littéraires
  • RDF
  • BiblioML DTD
    est une DTD pour les notices catalographiques au format UNIMARC
  • AuthoritiesML DTD
    est une DTD pour les notices d’autorités au format UNIMARC
  • MARC XML
    est une DTD pour les notices catalographiques au format MARC 21
  • JAIDTD
    (Journal Archiving and Interchange) est une DTD de la NLM pour les revues électroniques
  • NDLTD
    (Networked Digital Library of Theses and Dissertations) est une DTD pour les thèses électroniques US
  • répertoire des schémas XML de l’administration

Schéma ou modèle
Un schéma décrit la terminologie (les noms des balises) et les contraintes d’utilisation (structure, type de contenu).

Le format XML

XML est un format qui structure le contenu intellectuel de l’information dans un plan de description ( DTD ou schéma XML) et autorise une description de contenu dans une zone de métadonnées; la mise en forme du document est définie par une feuille de style rédigée en XSL (Extensible Style Language), langage de présentation associé à XML.

[[XML]] est un format de document primaire et non pas de référence de document.

Pour signaler un document XML, il suffit de le rendre accessible du réseau

SGBD XML : stockage de documents
Bases XML natives : stockage de gros volumes de fichiers XML, accès rapide, administration simple, structure arborescente, pas de fonctions relationnelles. Il n’est pas nécessaire de déstructurer le document comme lorsque l’on associe le format SGML à un SGBD.
Les fichiers XML peuvent être structurés selon une [[DTD]], mais ce n’est pas obligatoire. La base XML est l’outil idéal pour agréger de l’information provenant de plusieurs sources. Attention, il y a nécessité d’associer les fichiers XML à des bases de données relationnelles pour exploiter leurs informations (statistiques, calculs). Enfin, l’association DTD-XML tend lentement à évoluer vers l’association Schéma XML-XML, le schéma XML permettant d’imposer des contrôles sur les données saisies. Mais XML ne permet pas de savoir pourquoi telle balise a été utilisée. Par contre, le sens des balises peut être exprimé en [[RDF]] (Resource Description Framework), ce métalangage permet d’exprimer que des ressources ont des propriétés qui portent certaines valeurs.

Le format UNIMARC

Le premier objectif d’UNIMARC(MAchine Readable Cataloging) est de faciliter l’échange international de données bibliographiques. UNIMARC peut également être utilisé comme modèle pour le développement de nouveaux formats bibliographiques.
UNIMARC spécifie les codes définissant les données, c’est-à -dire les codes de zones, de sous-zones et les indicateurs attribués à un enregistrement bibliographique.
UNIMARC traite des monographies, des périodiques, des documents cartographiques, musicaux, des enregistrements sonores, des représentations graphiques, des diapositives, films et documents vidéos, et prévoit des zones pour la description des ressources électroniques.

Le format UNIMARC permet de retrouver des références de documents primaires, il s’agit d’un document secondaire qui regroupe des informations sur les documents primaires ; avec l’arrivée du numérique, on parlera alors de métadonnées.

Le format UNIMARC est appelé à évoluer vers les [[FRBR]] (Functional Requirements for Bibliographic Records) qui sont une norme [[IFLA]] permettant de localiser le support voulu par l’usager ou d’avoir connaissance du type de support pour un exemplaire affiché à partir du [[catalogue]].

Ejournals

Ejournals a pour origine la nécessité de disposer d’un outil spécifique pour présenter l’offre « périodiques électroniques » ; le SCD de l’Université Henri Poincaré ayant souscrit, en novembre 1999, un abonnement à Science Direct d’Elsevier (plus de 300 titres). A cette période, un rapide tour d’horizon des solutions mises en oeuvre, pour la plupart aux USA, m’a permis de mettre en évidence une solution basée sur le SGBD Access interfacé sur le web en ASP (Jackson Library). Cette solution présentait plusieurs avantages : un SGBD connu et facile à utiliser pour un coût très réduit, des compétences assez courantes à l’université. Je possédais les compétences sur le SGBD mais pas celles nécessaires à l’interfaçage. Je me suis tourné vers le Réseau de Ressources Informatiques (RRI) de l’Université Henri Poincaré qui a développé l’interface en une semaine en tenant compte des règlages et mises au point. La mise à disposition pour le public est datée du 24 janvier 2000. Les données étaient mises à jour dans la base Access et un simple transfert FTP du fichier permettait d’actualiser la base de consultation en ligne. Cette version de Ejournals donnait toute satisfaction du côté utilisateur, mais moins du côté administrateur, car c’est une solution client installé : il faut avoir une station de travail avec Access et le fichier de données. D’autre part, toute modification de la structure de la base impliquait un contact préalable avec la personne gérant l’interfaçage. En septembre 2001, nous nous sommes intéressés (Nicolas Morin et moi-même) aux logiciels « open source » et plus particulièrement au couple PHP/MySQL. Rapidement, nous avons décidé de produire un certain nombre d’outils sur cette base. Je me suis alors plus particulièrement intéressé au transfert des fonctionnalités de l’outil Ejournals. La première version Ejournals en PHP/MySQL a été mise en service le 20 mars 2002. L’intérêt de cette version réside d’une part dans la souplesse apportée au développement (les fonctionnalités sont créées au fur et à mesure des besoins) et d’autre part dans le fait que l’ensemble de l’outil (administration et consultation) est accessible à partir de n’importe quel navigateur web.

Adam BOMB

Adam Bomb (né Adam Brenner en 1963) est un chanteur et guitariste, ayant travaillé avec différents groupes. Son style évolue entre le hard rock et le glam metal.

Seattle

En 1979, à l’âge de 17 ans, lui et Geoff Tate jouèrent dans un coverband du nom de Tyrant. Plus tard, Adam rejoignit le groupe TKO, avec lequel il enregistra l’album In Your Face.

California

En 1982, alors âgé de 20 ans, Adam auditionna pour rejoindre le groupe Kiss, qu’il loupe de peu (il alla à Los Angeles et leur joua trois de leurs morceaux). Il partagea alors un appartement à Hollywood avec Jeffrey Isbelle, plus connu sous le nom d’Izzy Stradlin. Adam devint vite ami avec Tommy Thayer, un voisin guitariste du groupe Black ‘n Blue puis du groupe Kiss (groupe), qui lui suggéra de fonder son propre groupe, sous le nom d’Adam Bomb. En 1983, Adam enregistra ses premières démos, produites par Rick Keefer. Il joua aussi durant deux concerts avec Steeler, en remplacement d’Yngwie Malmsteen. Une année plus tard, Il enregistra d’autres morceaux avec l’aide du batteur Chuck Ruff(musicien) de Montrose (groupe) et du bassiste Cliff Williams du groupe AC/DC et finalisa son premier album, Fatal Attraction.

The Adam Bomb Band

Les années suivantes, Adam Bomb se produisit autant en solo qu’avec différents groupes ou personnes à travers le monde entier, tels que Chuck BerryJohnny Thunders et le guitariste de Billy Idol Steve Stevens, et enregistra plusieurs albums. Une nuit en 1993, alors qu’Adam jouait au Loft, Axl Rose monta sur scène et chanta avec Adam. Axl expliqua que lui et Izzy l’avaient vu jouer à un concert de TKO en 1983 au Troubadour (Hollywood) et qu’ils souhaitaient lui demander de rejoindre le groupe qu’ils commençaient, mais qu’ils avaient peur qu’Adam refuse.