Page précédente Table des matières Page suivante


3. Questions générales


3.1 Avant de commencer

Nous supposons que les lecteurs de ce document savent ce qu’est le format XML et qu’il n’y a donc pas besoin de le présenter. La présente section décrit le processus de conversion de données locales en documents XML conformes au PA AGRIS.

Le PA AGRIS, ou en termes de base de données, le modèle de données AGRIS, définit les règles de vocabulaire, de contenu et de structure utilisées pour le partage des données entre ensembles hétérogènes sans avoir à modifier le système local. Grâce à l’utilisation d’outils tels que XSLT, l’extraction et la conversion de l’information deviennent des tâches simples, bien qu’extrêmement importantes pour faciliter l’interopérabilité. Le document lui-même n’a pas besoin d’être joint à la métadonnée, ce qui simplifie le contrôle des droits d’accès qui lui sont attachés.

Le PA AGRIS s’accompagne d’une DTD[4] qui permet de valider les enregistrements soumis par divers centres de ressources. Les premières étapes sont les suivantes:

3.2 Exportation à partir de bases de données configurées pour le format XML

Pour produire et exporter sans difficulté des données XML depuis des bases de données locales vers le modèle PA AGRIS (voir figure 1 ci-dessous), la base de données source doit être configurée pour le format XML, c'est-à-dire qu’elle doit contenir des extensions permettant le transfert d’information entre des documents XML et leurs propres structures de donnée.

Les quatre étapes suivantes décrivent le processus de génération d’enregistrements XML AGRIS valides à partir de bases de données privées configurées pour le format XML:

1. identification des champs, dans le catalogue de la base de données locale, qui correspondront aux éléments et schémas de la DTD XML du PA AGRIS. Le document de configuration ainsi créé relie les champs de la base de données locales aux éléments et aux qualificatifs de la DTD;

2. une feuille de style XSLT permet de coder le document de configuration produit par les catalogueurs. Le modèle permet de relier et d’apparier les nœuds de chaque champ de la base de données locales avec les éléments et les schémas correspondants de la DTD XML du PA AGRIS;

3. les documents XML correctement constitués sont convertis en données XML PA AGRIS à l’aide du processeur XSL;

4. les documents XML sont validés par rapport à la DTD XML du PA AGRIS à l’aide de parseurs XML (3.2).

Figure 1: Processus de génération XML pour PA AGRIS

3.3 L’exemple OAI-PMH[6]

Le Protocole de l’initiative d’archives ouvertes pour la collecte de métadonnées (dont l’abbréviation en anglais est OAI-PMH, Open Archives Initiative Protocol for Metadata Harvesting) “fournit un cadre d’interopérabilité indépendant des applications et fondé sur la collecte de métadonnées ”. En appliquant le protocole OAI, les fournisseurs de données établissent une correspondance entre leur service local d’archivage et un format commun de métadonnées du Dublin Core (DC); ils peuvent ainsi générer des données XML bien formées et valides. La bibliothèque universitaire norvégienne des sciences de la vie (Norwegian Univ. Library of Life Sciences[7]), en tant que fournisseur de données, a appliqué le protocole OAI et mis ses métadonnées à la disposition du collecteur de données AGRIS à l’aide d’un identifiant unique (URI). Pour obtenir des informations détaillées sur la mise en œuvre de l’OAI-PMH, consultez le guide d’utilisation[8].

3.4 Transformation XSLT en métadonnées PA AGRIS

C’est avec les feuilles de style XSLT que l’on obtient la production finale de documents XML PA AGRIS valides. Le langage de feuilles de style extensible XSL fournit les éléments qui définissent des règles sur la manière de transformer un document XML en un autre document XML. Dans ce contexte, si la structure du service local d’archivage est conforme au DC, il n’y a aucune difficulté à élaborer une XSLT. Pour des formats de métadonnées plus compliqués, tels que le MARC, la procédure peut être plus laborieuse. Plusieurs options peuvent être envisagées, chacune ayant ses exigences spécifiques (différents champs, différentes conditions et règles à appliquer), et donc diverses feuilles de style à encoder.

L’un des centres de ressources AGRIS utilisant un ILMS configuré pour XML appelé InMagic se sert actuellement de l’exemple donné ci-après. Cet exemple montre comment une balise XML d’un enregistrement extrait par InMagic est transformé (à partir d’un XML “InMagic” bien formé en un XML PA AGRIS valide) en utilisant une expression XPath, qui adresse le noeud Title(titre) de la BD locale dans l’arborescence du résultat obtenu. En langage humain, l’instruction XSLT est la suivante: s’il existe un élément title (titre), sélectionnez-le et écrivez-le avec la balise XML PA AGRIS correcte qui, dans ce cas, est l’élément fondamental du Dublin Core dc:title.

Entrée

<inm:Title---Eng-M>Conservation and use of native tropical fruit species biodiversity in Asia</inm:Title---Eng-M>

Instructions XSLT

<xsl:if test="string-length(inm:Title---Eng-M)>0">
<dc:title xml:lang="eng">
<xsl:value-of select="inm:Title---Eng-M"/>
<xsl:text/>
</dc:title>
</xsl:if>

Sortie

<dc:title xml:lang="eng">Conservation and use of native tropical fruit species biodiversity in Asia</dc:title>

3.5 Outils de validation de documents XML

Des parseurs de validation vérifient la bonne forme des documents XML et leur conformité aux règles spécifiques de la DTD PA AGRIS. Le processus de validation peut être facilement réalisé avec le parseur XML Microsoft (MSXML) fourni dans Microsoft Internet Explorer. Dans la section suivante, nous verrons que la validation XML PA AGRIS est facilitée par le fait que la DTD AGRIS est située dans un emplacement défini (PURL).

D’autres parseurs XML, dont un grand nombre sont des logiciels libres, sont disponibles sur Internet[9]. L’outil le plus utilisé est XML Spy[10], progiciel complet permettant de créer, d’éditer et de valider des documents XML, XSL et des schémas DTD/XML.


[4] La DTD XML de PA AGRIS est disponible pour validation à http://purl.org/agmes/agrisap/dtd/ et pour affichage, à l'annexe A
[5] http://www.fao.org/agris/
[6] http://www.fao.org/agris/
[7] http://www.umb.no/
[8] http://www.openarchives.org/OAI/2.0/guidelines.htm
[9] http://www.xml.com/pub/rg/XML_Parsers
[10] http://www.altova.com

Page précédente Début de page Page suivante