Préservation des documents numériques

L’objectif de la préservation numérique est de maintenir la capacité :

  • d’afficher
  • d’extraire
  • d’utiliser les collections numériques sur le long terme

La pérennisation de l’information comprend :

  • la conservation physique des fichiers, des métadonnées associées, des scripts, des programmes
  • l’assurance d’une utilisation continue de la collection
  • le maintien de la sécurité de la collection

L’objet numérique est un objet d’information avec un contenu intellectuel. Au niveau le plus bas, il est représenté par une suite de bits, il se présente sous une forme codée et structurée, il est consultable par le biais de plates-formes logicielles et matérielles. A consulter :
Préservation des documents numériques
Unicode et ISO 10646
Le document numérique : notions fondamentales
Archivage pérenne des documents numériques

Le format de métadonnées METS

METS est un format de métadonnées (schéma XML) de gestion d’objets numériques complexes (un ou plusieurs fichiers numériques, un ou plusieurs formats de fichier, structure interne et externe de l’objet).

METS regroupe les métadonnées selon des fonctions bien précises :

  • Métadonnées descriptives : appréhender le contenu, identifier, échanger
  • Métadonnées administratives :
    • métadonnées techniques : conservation, restitution
    • métadonnées de gestion des droits : contrôle de l’accès, de l’usage
    • métadonnées de source et de provenance : lien avec document source, conservation de l’historique des modifications
  • Métadonnées de structure : connaître les fichiers composant le document, connaître la relation physique et logique entre ces fichiers

Concrétement, METS permet de conserver, de donner accès, d’échanger.

Structure d’un document METS :

  • entête contenant des informations sur le document METS
  • métadonnées descriptives
  • métadonnées administratives
  • section fichiers : liste des fichiers composant l’objet
  • carte de structure
  • liens de structure
  • comportement

A consulter :

Métadonnées de préservation

Les métadonnées de préservation permettent de constituer une base de données d’informations stockées avec l’archive afin de gérer :

  • les cycles de vie du document (cas des documents administratifs)
  • les versions et les éditions
  • les droits de propriété intellectuelle et/ou industrielle
  • les droits des utilisateurs
  • la vérification et la validation des formats

Fils RSS : applications en bibliothèque

L’objectif est d’évaluer les possibilités d’application des flux RSS dans le monde des bibliothèques. Il s’agit dans un premier temps de recenser les applications actuelles directement transposables.

Weblogs professionnels : outils de diffusion en temps réel des informations collectées par les professionnels

Informations concentrées dans une page web (aggrégation) : mise en place de pages d’informations thèmatiques ou de produits type « dossiers documentaires »

Informations produites dans un weblog : valorisation d’un fonds documentaire, fédération d’un ensemble d’utilisateurs, informations générales

Informations produites à partir d’une recherche : système analogue à la notion de profil documentaire (diffusion sélective de l’information)

Informations extraites d’un site web

Informations extraites d’un catalogue de bibliothèque

  • opac2rss.pl
    : outil permettant de se connecter au SIGB Horizon et d’en extraire les informations de prêts en cours, on peut imaginer d’une part l’extraction d’autres types de données telles que les nouveautés (déjà réalisé)… et d’autre part envisager l’application de cette technologie à d’autres SIGB. (exemple pour un SIGB
    )

Informations extraites d’une revue

Informations extraites d’une aggrégation de signets

Informations extraites d’un compte email

Informations accessibles sur un mobile

ARCHIMEDE

La Bibliothèque de l’Université Laval vient tout juste de lancer la troisième composante de son système de dépôt institutionnel qui se nomme ARCHIMEDE (archimede.bibl.ulaval.ca
). Ce module comporte les pré-publications, les post-publications et autres publications de recherche provenant des facultés et groupes de recherche.

Se basant sur une analyse exhaustive des solutions logicielles disponibles, incluant E-prints et D-Space, la bibliothèque a opté pour le développement de sa propre solution personnalisée. Inspiré du modèle D-space, ARCHIMEDE est orienté vers les communautés de recherche et est entièrement développé en « open source ». Le système est conforme à OAI (Open Archive Initiative), utilisant des métadonnées basées sur le Dublin Core. Une distribution « open source » de ARCHIMEDE est maintenant disponible.

Fils RSS : état de l’art

Le format RSS (« Rich Site Summary » ou « Real Simple Syndication » selon les sources) est un moyen simple pour extraire automatiquement de l’information d’un contenu régulièrement mis à jour.

Le format RSS
Le format RSS a peu évolué depuis sa création en 1999. La moitié des sites utilisent encore la version initiale 0.91. Une version plus complexe 1.0 a été un échec. Le mieux est d’utiliser directement le RSS 2.0, compatible avec la version 0.91 et dont la plupart des nouvelles options sont facultatives (spécifications officielles du RSS 2.0, traduction française). Si vous créez des fichiers RSS, il existe un validateur en ligne http://feedvalidator.org.

Les utilisations actuelles du RSS
Avec un fil RSS, on peut extraire de l’information de diverses sources : site web, weblog, messagerie, revue électronique, catalogue… L’extraction peut concerner tout ou partie de la source.

L’exploitation et la lecture des informations extraites par fil RSS peut s’effectuer selon divers processus :

  • Lecteur dédié de fil RSS
    L’information provenant d’un ou plusieurs fil RSS peut être lue, fédérée, syndiquée dans un lecteur installé comme logiciel client, ou rendue disponible sur un site web spécifique appelé agrégateur de fils RSS.
  • Navigateur web
    Les principaux navigateurs web du moment autorisent désormais la gestion des fils RSS au même titre que les signets ou favoris.
  • Lecteur de courriel
    Certains lecteurs de courriel permettent de collecter des informations provenant de fils RSS et de les gérer comme des messages électroniques.
  • Page web
    Un manière élégante de collecter l’information provenant de sources RSS est de l’organiser dans une page web

On voit clairement se dessiner un nombre important d’applications potentielles touchant aux domaines de l’information et de la documentation.

Les aspects techniques
Les formats RSS les plus répandus aujourd’hui sont :

  • RSS 0.91 / RSS 0.92 / RSS 2.0

    Le « fichier RSS » est souvent de type « rss.xml ».
    Il doit être conforme aux spécifications XML.
    Le fichier contient un élément (indiquant la version utilisée), comprenant lui-même un seul élement . Ce « channel » (canal, ou flux) comporte le contenu et les meta-données le d?crivant (balises), tout étant décrit dans plusieurs champs . Un « item » est en général une actualité.
    La version 2.0 est bien sûr la plus complète (par exemple, en version 0.91, on ne gère pas de date de publication et d’auteur par actualité, mais globalement pour tout le flux).
  • RSS 1.0
    Le « fichier RSS » est souvent de type « rss.rdf ».
    Il commence par l’élément principal , puis par un élément , et enfin par une liste d’éléments qui sont traités séparément (contrairement à RSS 0.91, qui englobe tous les items dans un « channel »).Ces deux types de formats sont donc différents, tant dans leurs syntaxes que dans les normes sur lesquelles ils s’appuient.
  • exemple de fichier RSS

Fils RSS et navigateurs Web

Certains navigateurs Web permettent d?sormais de lire des fils RSS et de les « bookmarker » comme de simples favoris.
Je retiens 2 navigateurs avec des fonctionnalit?s diff?rentes.
le fil RSS est ajout? comme un favori, le fait de pointer dessus ouvre une fen?tre listant les titres des posts du fil concern?. Comme pour les favoris des regroupements peuvent ?tre effectu?s par dossier.
les fils RSS b?n?ficient d’outils pour ajouter ou organiser. Ils apparaissent dans un onglet sp?cifique et/ou dans une barre de navigation. A mon sens, c’est ce qui se fait de mieux pour le moment.

Journée OAI 15 octobre 2004 Zurich

Définitions : L’Open Access est l’archivage électronique en accès libre des articles acceptés et publiés dans les revues scientifiques. Les documents signalés dans une archive institutionnelle répondant aux principes de l’Open Archive Initiative (http://www.soros.org/openaccess/
) et de la déclaration de Berlin (http://www.zim.mpg.de/openaccess-berlin/berlindeclaration.html
) ont été pour la plupart évalués par les pairs car – publiés dans des revues – présentés à des congrès ou séminaires – soumis à des comités de lecture

L’objectif de l’OA est de maximiser l’accès ? la recherche scientifique publiée ainsi que l’impact des publication et de leurs auteurs, grâce à l’archivage institutionnel des publications.

Quel avantage de mettre en ligne ses publications en open access ?
Il existe une corrélation directe entre le taux de citation d’un article dans la littérature et le nombre de téléchargements lorsqu’il est mis en ligne en open access. La courbe des téléchargements est identique à celle des citations, mais celles-ci se produisent plus tard. Le nombre de téléchargements permet d’anticiper le taux de citation à venir. ceci est très pratique pour évaluer un jeune chercheur qui aurait publié récemment et mis ses publications en open access.

Où nous mêne l’open access ? Est-ce que ses principes ne vont pas détruire le système de communication scientifique actuel ? Comment sera faite l’évaluation des chercheurs ? Le débat sur ces questions oppose les tenants du système de publication par le biais des revues commerciales vendues sur abonnement et les tenants de nouveaux modèles économiques qui proposent que les revues se financent par le biais de paiement lors de la soumission d’articles. Tous sont néanmoins d’accord que les éditeurs scientifiques (publishers) apportent un savoir faire et une valeur ajoutée au processus de publication, et que le système de contrôle par les pairs de la qualité des publications scientifiques (peer-review) doit être conservé. Stevan Harnad, le théoricien de l’OA, explique tout dans sa « Self-Archiving FAQ » http://www.eprints.org/self-faq/

L’open access a déjà commencé à transformer le processus de publication et de diffusion de la connaissance scientifique. Plus de 90% (en nombre) des éditeurs scientifiques acceptent que les chercheurs auto-archivent leurs articles après publication, dans un délai de temps variable selon les domaines. Par ailleurs plusieurs pays et institutions de recherche ont d’ores et déjà accepté et mis en oeuvre le principe de l’open access et incitent leurs chercheurs à publier dans les revues de ce type.

Que dit le droit ? Un chercheur ou son institution peuvent-il mettre en ligne ses propres publications ?

Si, lors de la publication dans une revue ou lors d’une conférence, un chercheur a signé un contrat d’édition qui ne lui fait pas perdre ce droit, lui-même ou son institution peuvent autoarchiver la publication sous forme électronique et la rendre librement accessible sur leur propre serveur. Comme signalé ci-dessus, en octobre 2004, plus de 90% des ?diteurs scientifiques avaient déjà accepté ce type d’archivage. Pour être sûr de son droit à autoarchiver, il est préférable que le chercheur vérifie auprès de son éditeur ce qu’il en est, au moment où il soumet un nouvel article pour publication, ou avant mise en ligne pour d’anciens articles. Son institution peut le faire pour lui ou l’aider dans cette tâche.

texte de David Aymonin

LUKE

Ce groupe bordelais se forme après la dernière tournée du groupe Spring où Christophe Plantier (guitare) officiait et où Thomas Boulard, Bordelais d’origine, venait d’entrer. Le duo est ensuite rejoint par Ludovic Morillon (batterie), Stéphane Bouvier (basse, ex Purr1) et Cyril Guillaneuf (claviers).
Luke envoie de nombreuses démos et un 7 titres auto produit de 1999, avant d’être repéré par le label Village Vert, dans les locaux duquel Thomas Boulard avait ses habitudes bien avant de signer. Ils sortent en 2000 un premier maxi de 4 titres, Je n’éclaire que moi.
C’est alors qu’ils préparent leur premier album intitulé La Vie presque, mélange de rock français et de pop anglaise. L’album sort en octobre 2001 et se caractérise par une utilisation intensive du parlé/chanté par Thomas Boulard. Luke part sur les routes…
Fin 2003, le groupe enregistre en studio et à Grand Piquey son second opus, La Tête en arrière, dont est extrait leur premier single, La Sentinelle, suivi plus tard par SoledadLe Reste Du Monde et Hasta Siempre. Luke connaît enfin le succès, son album se classe 14e et reste 81 semaines dans les charts français. Entre temps, le groupe a évolué pour cause de différends. Il ne reste de la formation originale que Thomas Boulard et Cyril Guillaneuf, rejoints par Damien Lefèvre (du groupe Eiffel) à la basse et Romain Viallon (Catléya) à la batterie. L’album sort en avril 2004.
Luke part sur les routes jusqu’à fin 2004 et prend à son bord Bayrem Benamor à la guitare, recruté par Internet, tandis que Cyril Guillaneuf quitte l’aventure.
En 2005, Luke repart en tournée après une courte pause et change une nouvelle fois de guitariste avec Jean-Pierre Ensuque (du groupe Autour de Lucie). À la mi-octobre, le groupe entame une série de dates dans toute la France avec le trio Déportivo.
Après une année de repos, le groupe sort un nouvel album intitulé Les Enfants de Saturne le  qui se classe 8e en France et commence une nouvelle tournée en juin 2007. Le nouveau single sort en juin 2007 et s’appelle La terre ferme. Suivra plus tard le single Stella.
Le 17 novembre 2008, le groupe met en rayon un album live intitulé Où en est la Nuit, résultat d’une année de tournée et dont le premier single est une version live de Un seul jour. L’album comporte une édition spéciale avec un DVD bonus.
En février 2010 le groupe sort un nouvel album nommé D’autre part dont le premier single s’intitule Pense à Moi et est disponible en téléchargement sur le site officiel du groupe. Cet album se classe 15e. Le design de la pochette de cet album est réalisé par Yann Nguema, bassiste et graphiste du groupe EZ3kiel.
Fin 2014, ils annoncent l’arrivée de leur cinquième album. En juillet 2015 est annoncée la sortie pour le 9 octobre 2015 avec un extrait de studio sur la page Facebook du groupe ainsi qu’une tournée à partir d’aout. Le 20 juillet le titre de l’album Pornographie est annoncé et le 24 juillet sort le premier extrait C’est la guerre. Une semaine avant le sortie du cinquième album, le groupe sort le deuxième single, Warrior. Cet album est marqué en premier lieu par le renouvellement entier des membres du groupe, excepté de Thomas Boulard, mais aussi par des paroles plus crues que d’habitude pour le groupe. C’est un album très sombre, reflet de l’époque dans laquelle il est réalisé (Thomas Boulard critique la télé-réalité, les médias, les discothèques,…). D’ailleurs, dans un style très particulier, beaucoup moins direct que celui d’autres auteurs, il dénonce l’extrême droite française dans certains de ses titres.
La sortie de cet album est suivie par une tournée appelée Pornotour, qui va durer jusqu’à fin 2016.
(Vu au Terminal Export à Nancy en 2004)