Nous supposons que les lecteurs de ce document savent ce quest le format XML et quil ny a donc pas besoin de le présenter. La présente section décrit le processus de conversion de données locales en documents XML conformes au PA AGRIS.
Le PA AGRIS, ou en termes de base de données, le modèle de données AGRIS, définit les règles de vocabulaire, de contenu et de structure utilisées pour le partage des données entre ensembles hétérogènes sans avoir à modifier le système local. Grâce à lutilisation doutils tels que XSLT, lextraction et la conversion de linformation deviennent des tâches simples, bien quextrêmement importantes pour faciliter linteropérabilité. Le document lui-même na pas besoin dêtre joint à la métadonnée, ce qui simplifie le contrôle des droits daccès qui lui sont attachés.
Le PA AGRIS saccompagne dune DTD[4] qui permet de valider les enregistrements soumis par divers centres de ressources. Les premières étapes sont les suivantes:
utilisez la dernière version des spécifications du PA AGRIS et de la DTD. Si ce nest pas le cas, téléchargez-la sur le site AGRIS[5],
lisez les spécifications,
comprenez bien les besoins de la DTD XML du PA AGRIS. Des besoins et des contraintes spécifiques sont issus de la base de données locale et des systèmes de conversion utilisés dans la structure des données AGRIS. Étant donné que lobjectif de ce projet est doffrir la plus grande flexibilité possible au niveau tant de la structure que du contenu des documents XML, la DTD actuelle indique cinq éléments fondamentaux obligatoires,
établissez une correspondance entre les éléments de la structure de votre système local et les éléments et schémas de la DTD AGRIS.
Pour produire et exporter sans difficulté des données XML depuis des bases de données locales vers le modèle PA AGRIS (voir figure 1 ci-dessous), la base de données source doit être configurée pour le format XML, c'est-à-dire quelle doit contenir des extensions permettant le transfert dinformation entre des documents XML et leurs propres structures de donnée.
Les quatre étapes suivantes décrivent le processus de génération denregistrements XML AGRIS valides à partir de bases de données privées configurées pour le format XML:
1. identification des champs, dans le catalogue de la base de données locale, qui correspondront aux éléments et schémas de la DTD XML du PA AGRIS. Le document de configuration ainsi créé relie les champs de la base de données locales aux éléments et aux qualificatifs de la DTD;
2. une feuille de style XSLT permet de coder le document de configuration produit par les catalogueurs. Le modèle permet de relier et dapparier les nuds de chaque champ de la base de données locales avec les éléments et les schémas correspondants de la DTD XML du PA AGRIS;
3. les documents XML correctement constitués sont convertis en données XML PA AGRIS à laide du processeur XSL;
4. les documents XML sont validés par rapport à la DTD XML du PA AGRIS à laide de parseurs XML (3.2).
Figure 1: Processus de génération XML pour PA AGRIS
Le Protocole de linitiative darchives ouvertes pour la collecte de métadonnées (dont labbréviation en anglais est OAI-PMH, Open Archives Initiative Protocol for Metadata Harvesting) fournit un cadre dinteropérabilité indépendant des applications et fondé sur la collecte de métadonnées . En appliquant le protocole OAI, les fournisseurs de données établissent une correspondance entre leur service local darchivage et un format commun de métadonnées du Dublin Core (DC); ils peuvent ainsi générer des données XML bien formées et valides. La bibliothèque universitaire norvégienne des sciences de la vie (Norwegian Univ. Library of Life Sciences[7]), en tant que fournisseur de données, a appliqué le protocole OAI et mis ses métadonnées à la disposition du collecteur de données AGRIS à laide dun identifiant unique (URI). Pour obtenir des informations détaillées sur la mise en uvre de lOAI-PMH, consultez le guide dutilisation[8].
Cest avec les feuilles de style XSLT que lon obtient la production finale de documents XML PA AGRIS valides. Le langage de feuilles de style extensible XSL fournit les éléments qui définissent des règles sur la manière de transformer un document XML en un autre document XML. Dans ce contexte, si la structure du service local darchivage est conforme au DC, il ny a aucune difficulté à élaborer une XSLT. Pour des formats de métadonnées plus compliqués, tels que le MARC, la procédure peut être plus laborieuse. Plusieurs options peuvent être envisagées, chacune ayant ses exigences spécifiques (différents champs, différentes conditions et règles à appliquer), et donc diverses feuilles de style à encoder.
Lun des centres de ressources AGRIS utilisant un ILMS configuré pour XML appelé InMagic se sert actuellement de lexemple donné ci-après. Cet exemple montre comment une balise XML dun enregistrement extrait par InMagic est transformé (à partir dun XML InMagic bien formé en un XML PA AGRIS valide) en utilisant une expression XPath, qui adresse le noeud Title(titre) de la BD locale dans larborescence du résultat obtenu. En langage humain, linstruction XSLT est la suivante: sil existe un élément title (titre), sélectionnez-le et écrivez-le avec la balise XML PA AGRIS correcte qui, dans ce cas, est lélément fondamental du Dublin Core dc:title.
Entrée
<inm:Title---Eng-M>Conservation and use of native tropical fruit species biodiversity in Asia</inm:Title---Eng-M> |
Instructions XSLT
<xsl:if test="string-length(inm:Title---Eng-M)>0"> |
Sortie
<dc:title xml:lang="eng">Conservation and use of native tropical fruit species biodiversity in Asia</dc:title> |
Des parseurs de validation vérifient la bonne forme des documents XML et leur conformité aux règles spécifiques de la DTD PA AGRIS. Le processus de validation peut être facilement réalisé avec le parseur XML Microsoft (MSXML) fourni dans Microsoft Internet Explorer. Dans la section suivante, nous verrons que la validation XML PA AGRIS est facilitée par le fait que la DTD AGRIS est située dans un emplacement défini (PURL).
Dautres parseurs XML, dont un grand nombre sont des logiciels libres, sont disponibles sur Internet[9]. Loutil le plus utilisé est XML Spy[10], progiciel complet permettant de créer, déditer et de valider des documents XML, XSL et des schémas DTD/XML.
[4] La DTD XML de PA AGRIS
est disponible pour validation à http://purl.org/agmes/agrisap/dtd/
et pour affichage, à l'annexe A [5] http://www.fao.org/agris/ [6] http://www.fao.org/agris/ [7] http://www.umb.no/ [8] http://www.openarchives.org/OAI/2.0/guidelines.htm [9] http://www.xml.com/pub/rg/XML_Parsers [10] http://www.altova.com |