Social Metadata

Un article que m’a transmis une collègue …

Les métadonnées sociales sont souvent des informations ajoutées par les usagers. Il peut s’agir de simples tags, d’images, de liens mais cela peut aller jusqu’à la mise en place de contenus élaborés (blogs). L’objectif est de permettre d’améliorer la compréhension et l’évaluation de l’information primaire.

L’intérêt de savoir gérer ce type d’apport est important pour les bibliothèques, principalement dans le cadre de la dissémination des services dans les réseaux sociaux.Il semble que ce point devra être considéré attentivement lors de la mise en place ou le renouvellement d’outils, d’interfaces, d’Opacs par les bibliothèques.

Easy Door

Isidore est un portail SHS du CNRS basé sur le web sémantique. L’interface destinée à la recherche d’information est structurée exactement comme un blog, donc très ergonomique et fonctionnelle ; sa prise en main est intuitive. On y trouve un nuage de tags, des facettes, des possibilités de partage avec les outils du web 2.0 (réseaux sociaux, plateformes de signets…).

Comment cet outil est-il architecturé, comment fonctionne-t-il ? La rubrique « A propos » donne les premiers éléments de réponse, mais il faut télécharger le « Guide des bonnes pratiques numériques » pour avoir des informations détaillées.

Isidore collecte, filtre, indexe des métadonnées : c’est essentiellement un agrégateur de métadonnées. Il faut préciser tout de même que certaines métadonnées ne sont pas collectées, mais simplement consultées grâce au protocole SRU/SRW proche du Z39.50, cela concerne les serveurs de données bibliographiques. Pour les autres ressources, la collecte est assurée soit par le protocole OAI/PMH (archives ouvertes par exemple), soit par le protocole Sitemap +RDFa (blogs, sites web…), soit les flux de syndication de type RSS.

Le format de données est le XML (version XML du MARC21 ou de l’UNIMARC dans le cas des serveurs bibliographiques), les schémas de données sont standards : RSS 2.0, ATOM, Dublin Core, METS et RDF. Certains référentiels CNRS ont déjà été intégrés : Pactols, termSciences, Calenda, Geonames, HAL ; de même que RAMEAU. Seul ce dernier est vraiment universel, quand aux référentiels HAL, je pense que le terme est inapproprié, c’est peut être simplement un défaut de jeunesse.

En résumé, une bien belle application qui ouvre une nouvelle voie pour ceux qui souhaitent offrir à leurs utilisateurs une interface de recherche unique dédiée.

Le format de métadonnées METS

METS est un format de métadonnées (schéma XML) de gestion d’objets numériques complexes (un ou plusieurs fichiers numériques, un ou plusieurs formats de fichier, structure interne et externe de l’objet).

METS regroupe les métadonnées selon des fonctions bien précises :

  • Métadonnées descriptives : appréhender le contenu, identifier, échanger
  • Métadonnées administratives :
    • métadonnées techniques : conservation, restitution
    • métadonnées de gestion des droits : contrôle de l’accès, de l’usage
    • métadonnées de source et de provenance : lien avec document source, conservation de l’historique des modifications
  • Métadonnées de structure : connaître les fichiers composant le document, connaître la relation physique et logique entre ces fichiers

Concrétement, METS permet de conserver, de donner accès, d’échanger.

Structure d’un document METS :

  • entête contenant des informations sur le document METS
  • métadonnées descriptives
  • métadonnées administratives
  • section fichiers : liste des fichiers composant l’objet
  • carte de structure
  • liens de structure
  • comportement

A consulter :

Métadonnées de préservation

Les métadonnées de préservation permettent de constituer une base de données d’informations stockées avec l’archive afin de gérer :

  • les cycles de vie du document (cas des documents administratifs)
  • les versions et les éditions
  • les droits de propriété intellectuelle et/ou industrielle
  • les droits des utilisateurs
  • la vérification et la validation des formats

DTD et schémas

DTD

  • Docbook DTD
    est une [[DTD]] pour les ouvrages et articles du domaine de l’informatique
  • EAD DTD
    (Encoded Archival Description) est une DTD pour les documents d’archives
  • TEI DTD
    (Text Encoding Initiative) est une DTD pour les ouvrages littéraires
  • RDF
  • BiblioML DTD
    est une DTD pour les notices catalographiques au format UNIMARC
  • AuthoritiesML DTD
    est une DTD pour les notices d’autorités au format UNIMARC
  • MARC XML
    est une DTD pour les notices catalographiques au format MARC 21
  • JAIDTD
    (Journal Archiving and Interchange) est une DTD de la NLM pour les revues électroniques
  • NDLTD
    (Networked Digital Library of Theses and Dissertations) est une DTD pour les thèses électroniques US
  • répertoire des schémas XML de l’administration

Schéma ou modèle
Un schéma décrit la terminologie (les noms des balises) et les contraintes d’utilisation (structure, type de contenu).