Moissonnage OAI

Le protocole OAI est n? d’une initiative pour l’auto-archivage des pr?-publications scientifiques. Le protocole OAI-PMH
est fond? sur la collecte des m?tadonn?es dans des fonds autoris?s, les ressources restant sous la responsabilit? du site moissonn?.
L’OAI permet aux ?tablissements documentaires d’?tre fournisseurs de donn?es en constituant des entrep?´ts normalis?s. Les SCD peuvent mettre en valeur leurs fonds sp?cifiques (th?ses, rapports d’?tude, cours, …) et valorisent aussi leur institution de tutelle.

Le moissonnage OAI est une fonctionnalit? tr?s int?ressante sur le plan documentaire par :

  • l’automatisme de cette proc?dure qui est un atout majeur de la constitution d’une collection
  • l’existence d’un protocole standard OAI-PMH
    pour le moissonnage des m?tadonn?es
  • la possibilit? de f?d?rer des fonds documentaires dispers?s et de tailles indiff?rentes
  • la s?lection de la nature des fonds ? moissonner
  • l’utilisation d’un outil de recherche sur des fonds documentaires valid?s
  • la possibilit? d’utiliser cette ressource dans un SID au travers d’un r?solveur de liens
  • la possibilit? de f?d?rer des moissonneurs OAI entre eux
  • ? l’inverse, la possibilit? de disposer d’un entrep?´t OAI pouvant ? son tour ?tre moissonn?, donc de le valoriser

AOIster
est un projet de l’Universit? du Michigan
(Digital Library Production Service). dont le but est de cr?er une collection librement accessible.
AOIster propose un lien OpenURL pour une utilisation avec un r?solveur de liens.

Modèle de référence OAIS – Norme ISO 14721

Le modèle de référence OAIS est un modèle normatif aidant à comprendre la problèmatique de l’archivage des documents numériques. C’est aussi un système d’archivage ouvert qui est devenu une norme internationale ISO 14721 qui sera publiée courant 2005.

Information descriptive de la pérennisation :

  • la provenance décrit l’origine du contenu de l’information
  • le contexte décrit le rapport entre le contenu d’information et d’autres informations extérieures
  • l’identification fournit un ou plusieurs identifiants permettant de repérer le contenu de façon unique
  • l’intégrité : système protégent le contenu contre un changement non document?

Un modèle fonctionnel sera organisé autour des modules suivants :

  • Versement : préparation du contenu en vue du stockage et de la gestion des données au sein de l’archive
  • Règles de soumission : critères permettant de déterminer les types d’information souhaités et autorisés, de s’assurer que les informations sont conformes aux normes internes OAIS
  • Stockage : services relatifs au stockage, à la maintenance et à la récupération des données (gestion de la hiérarchie du stockage, surveillance et renouvellement des supports, contrôles d’erreurs, contrôles des accès…)
  • Gestion des données : gestion de l’enrichissement, de la mise à jour et de l’accès aux données descriptives et administratives pour gérer l’archive
  • Planification de la préservation : recommandations pour garantir l’accès à long terme à l’information archivée (veille technologique, planification des migrations, évaluation des risques, développement des stratégies de préservation, surveillance des producteurs et des utilisateurs)
  • Administration : gestion du fonctionnement global de l’archive (négociation des accords de soumission, gestion de la configuration matérielle et logicielle, contrôle de l’accès physique)
  • Accès : interface unique entre les utilisateurs et les fonds d’archives
  • Services de base : services du système d’exploitation, services du réseau, services de sécurité

ARCHIMEDE

La Bibliothèque de l’Université Laval vient tout juste de lancer la troisième composante de son système de dépôt institutionnel qui se nomme ARCHIMEDE (archimede.bibl.ulaval.ca
). Ce module comporte les pré-publications, les post-publications et autres publications de recherche provenant des facultés et groupes de recherche.

Se basant sur une analyse exhaustive des solutions logicielles disponibles, incluant E-prints et D-Space, la bibliothèque a opté pour le développement de sa propre solution personnalisée. Inspiré du modèle D-space, ARCHIMEDE est orienté vers les communautés de recherche et est entièrement développé en « open source ». Le système est conforme à OAI (Open Archive Initiative), utilisant des métadonnées basées sur le Dublin Core. Une distribution « open source » de ARCHIMEDE est maintenant disponible.

Tour d’horizon des logiciels – archives ouvertes –

L’objectif est de mettre en place un outil permettant de déposer, de stocker, d’indexer et de publier des documents produits par l’Université tels que les thèses…

EPrints est développé par l’Université de Southampton, il est utilisé pour le serveur de thèses du CNRS.

DSpace est développé par les bibliothèques du MIT sous le nom de MIT’s digital repository.

CDSware est développé par le CERN sous le nom de CERN Document Server.

Greenstone est développé par l’Université de Waikato.

i-Tor est développé par le NISIS.

MyCoRe est un projet allemand.

L’Open Society Institute a mis en ligne un guide sur les logiciels de gestion d’archives institutionnelles ; il présente de façon très détaillée les fonctionnalités des 5 outils en open source disponibles actuellement (sauf Greenstone).

Archives ouvertes

Groupe de travail Archives Ouvertes (Couperin)

OAI (Open Archives Initiative)
Open Archives Forum

Logiciels d’archives ouvertes
i-Tor / CDSware / DSpace / EPrints / Greenstone / MyCore

Les archives ouvertes dans la communication scientifique / G. Chartron (2003)
Le protocole OAI et ses usages en bibliothèque
La communication scientifique revue et corrigée par Internet
Introduction au concept d’archive ouverte / MF Fily (30 juin 2005)
Position of CNRS (France) on Open Access
Archives ouvertes – Vers une obligation de dépôt ?

Dans le contexte du mouvement OAI (Open Archive Initiative), le terme « Open » concerne l’architecture technique de ces archives et n’est pas synonyme de gratuité d’accès. Il s’agit de définir des protocoles communs pour permettre une facilité d’utilisation du contenu par un ensemble de services extérieurs. Convergence forte avec le mouvement « Open source » de l’informatique libre. Un logiciel libre, contrairement à une idée commune répandue, ne signifie pas que ce logiciel soit gratuit. Un logiciel est qualifié de « libre » dans la mesure où l’accès à son code-source est libre, ce qui donc n’a rien à voir avec son prix. Chacun peut utiliser, copier, distribuer et modifier librement un logiciel libre. Par ailleurs, les sociétés commerciales peuvent éventuellement en tirer profit en le distribuant. Le logiciel libre s’oppose à la notion de logiciel propriétaire dont l’utilisation, la redistribution et toute modification sont interdites ou exigent une autorisation spécifique. Il faut donc conclure sur une certaine ambiguïté du terme « Archive ouverte », il n’a pas la même signification selon son contexte d’utilisation. Dans les discours dominants, il est plutôt assimilé à des réservoirs d’articles en accès libre, sans barrière économique et juridique, intégrant ou non des protocoles d’interopérabilité.