La DTD AGRIS fournit un ensemble déléments, de raffinements et de schémas qui permettent de décrire et de former la structure constituant le format XML dun enregistrement bibliographique. Il est indispensable, lors de la création ou de lexportation de documents XML conformes au PA AGRIS, de joindre len-tête figurant ci-après.
<?xml version="1.0"
encoding="UTF-8"?> |
Tous les documents XML doivent déclarer quils sont des documents XML en insérant la déclaration XML ci-après:
<?xml version="1.0" encoding="UTF-8"?> |
Cette ligne indique au logiciel recevant le fichier de données XML que le langage utilisé est le XML et que le fichier est conforme à la spécification XML, version 1.0. La question du codage est abordée ultérieurement. Cette ligne ne constitue pas vraiment une balise XML contenant des données et il nest donc pas nécessaire dinsérer une balise de fermeture. Cette ligne doit être placée au début du document
Lorsque lon balise un document avec une DTD, il est dusage dinclure une déclaration DOCTYPE afin que les outils de traitement «sachent» à quelle DTD se conforme le document traité. Lorsquun parseur valide un document XML par rapport à une DTD, le document est contrôlé pour vérifier que tous les éléments requis sont présents et quaucun élément non déclaré na été ajouté. La structure hiérarchique des éléments définis dans la DTD doit être conservée Les valeurs de tous les attributs seront vérifiées pour sassurer quelles correspondent aux recommandations. En résumé, tous les détails du document XML, du début à la fin, seront définis et validés par la DTD. La vérification de luniformité entre les groupes de documents XML, tels que ceux collectés par le service darchivage AGRIS à partir de centres répartis dans le monde entier, est ainsi simplifiée.
<!DOCTYPE ags:resources SYSTEM "http://purl.org/agmes/agrisap/dtd/"> |
La déclaration DOCTYPE ci-dessus relative à un document AGRIS balisé à laide de la DTD AGRIS indique que le type de document est ags:resources et quil est conforme à la DTD. Le fait dexiger quun document XML soit validé par rapport à la DTD AGRIS permet de garantir lintégrité de la structure des données. Les documents XML peuvent être parsés et validés antérieurement à leur chargement par lapplication.
Cette déclaration renvoie à un localisateur persistant de ressources uniformes (PURL), ce qui facilite la validation, à condition que lordinateur soit connecté à Internet. Si ce nest pas le cas, utilisez la DTD figurant en annexe.
Les déclarations despaces de nom se placent après la référence DTD XML. Étant donné que les documents peuvent contenir plusieurs espaces de nom et quil existe un risque de collision entre préfixes, les espaces de nom permettent aux développeurs détablir une correspondance entre les préfixes et les URI pour les éléments et leur contenu, sans se limiter au document.
<ags:resources |
xmlns:ags="http://purl.org/agmes/1.1/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:agls="http://www.naa.gov.au/recordkeeping/gov_online/agls/1.2"> |
Lexemple ci-dessus contient quatre déclarations despaces de nom: ags, dc, dcterms et agls. En général, un espace de nom définit de façon unique un ensemble de noms ou de balises; on évite ainsi toute équivoque lorsque des balises de différentes origines, mais portant les mêmes noms, sont mélangées. Ainsi, dcterms:citation est différent de ags:citation.
Les structures suivantes sont utilisées pour décrire la classe AGRIS de documents: Text only (dc:type, dc:source, etc.), Element only (dc:citation, agls:availability, etc.) et Mixed content (dc:title or dc:relation). Text only nest utilisé que pour du texte; Element only, que pour des éléments et Mixed content, pour un contenu mixte. Tous les attributs sont des chaînes de données textuelles (CDATA), à lexception de ags:ARN, qui est un identifiant unique pour lélément racine ags:resource (ID), et de lattribut réservé xml:lang qui, lorsquappliqué, doit être restreint aux trois lettres du code langue ISO639-2[12].
A lintérieur de la DTD, la cardinalité des éléments est indiquée par les opérateurs de cardinalité suivants.
(Pas dindicateur) |
Obligatoire |
Un et un seul |
+ |
Obligatoire, Répétable |
Un ou plus |
? |
Facultatif |
Aucun ou un |
* |
FacultatifRépétable |
Aucun, un ou plus |
Cette section explique comment coder chaque élément, raffinement et schéma pour créer des éléments XML bien formés. Chaque tableau décrit le modèle de contenu de lélément. Le modèle indique comment baliser le contenu et les attributs, et précise son caractère obligatoire ou facultatif.
Cet attribut remplace le champ AGRIS précédent pour le numéro denregistrement provisoire (TRN, Temporary Record Number). Il possède une contrainte de validité didentité qui confère lunicité à une ressource AGRIS. Il est donc primordial, pour différencier deux enregistrements, dutiliser un système unique de numérotation. LARN est obligatoire pour toute entrée soumise à AGRIS. Le format utilisé pour cet attribut est constitué de 12 caractères, divisés en quatre groupes. Un ARN contient généralement:
a) le code du pays, en deux lettres, répondant à la norme ISO. Il sagit du code de pays du centre de ressources AGRIS ou du code de linstitution multinationale ou internationale ayant préparé lentrée. La liste des codes géographiques des centres AGRIS figure dans le standard ISO3166-1. Les codes AGRIS utilisés aujourdhui par les centres sont spécifiés dans lannexe C du guide de lutilisateur du PA AGRIS ou sur le site web AGRIS;
b) lannée durant laquelle lentrée est préparée. Elle se compose de quatre chiffres et ne doit pas être confondue avec lannée de publication du document;
c) le sous-code attribué par le centre de ressources (1 caractère seulement). Ce sous-code est utilisé par les pays ayant plus dun centre de préparation des entrées pour AGRIS. Il ne comporte quun seul caractère (une lettre ou un chiffre). Pour les pays qui ont plus de neuf sous-centres, il peut sagir dune lettre. Pour les pays qui nont quun seul centre de préparation et de soumission des entrées, la case comportera un zéro (0);
d) un numéro composé de cinq chiffres. Ce chiffre est attribué par le centre participant à chaque année ou représente un numéro local de classification, tel quun numéro interne dune bibliothèque. Exemple:
ags:resource est lélément racine et contient tous les autres éléments fondamentaux et les qualificatifs. Cinq éléments fondamentaux sont obligatoires: le titre, la date, le sujet, la langue et la disponibilité. Il sagit de lélément le plus important dans la mesure où il contient le reste du document et devient synonyme du type de document.
Modèle de contenu XML |
(dc:title+, dc:creator*, dc:publisher*, dc:date+, dc:subject+, dc:description*, dc:identifier*, dc:type*, dc:format*, dc:language+, dc:relation*, agls:availability+, dc:source?, dc:coverage*, dc:rights*, ags:citation*) |
|
Balise XML |
<ags:resource ags:ARN="XF2004000244"> </ags:resource> |
|
Attributs/schémas XML |
ags:ARN (voir 4.3.1). |
Obligatoire |
Ce champ sert à indiquer le titre du document et le cas échéant, sa traduction (dcterms:alternative).
Modèle de contenu XML |
(#PCDATA | dcterms:alternative)* |
|
Balise XML |
<dc:title
xml:lang="eng">title
of resource |
|
Attributs/schémas XML |
xml:lang |
Obligatoire |
Cet élément décrit toutes les entités (Agents) responsables du contenu intellectuel dune ressource documentaire et indique parfois la contribution de chaque créateur à la ressource. Il peut sagit de dune personne (ags:creatorPersonal), dune organisation, dun service ou dun organisme (ags:creatorCorporate), ou bien encore dune réunion (ags:creatorConference).
Modèle de contenu XML |
(ags:creatorPersonal | ags:creatorCorporate | ags:creatorConference)* |
|
Balise XML |
<dc:creator> |
|
Attributs/schémas XML |
- |
|
Cet élément se compose de deux raffinements et renseigne sur léditeur. Il indique le nom de la personne, du groupe ou de lorganisation contrôlant ou publiant le document (ags:publisherName) et le lieu de publication (ags:publisherPlace).
Modèle de contenu XML |
(ags:publisherName | ags:publisherPlace)* |
|
Balise XML |
<dc:publisher> |
|
Attributs/schémas XML |
- |
|
Cet élément indique la date de mise à disposition du document et doit être accompagné de son qualificatif (dcterms:dateIssued).
Modèle de contenu XML |
dc:date (dcterms:dateIssued) |
|
Balise XML |
<dc:date> |
|
Attributs/schémas XML |
scheme (dcterms:W3CDTF) |
|
Ce champ est utilisé pour indiquer le sujet du document. Il peut sagir dun texte libre (dc:subject), ou être indexé à partir dun plan de classification (ags:subjectClassification) ou dun vocabulaire contrôlé (ags:subjectThesaurus).
Modèle de contenu XML |
(#PCDATA | ags:subjectClassification | ags:subjectThesaurus)* |
|
Balise XML |
<dc:subject> |
|
Attributs/schémas XML |
ags:subjectClassification |
Obligatoire Obligatoire Obligatoire |
Cet élément sert à décrire le document. Il peut sagir dun texte concis, dune annotation, dun commentaire ou dun éclaircissement relatifs à un quelconque aspect du document (ags:descriptionNotes), dune version officielle de la série de données ou du document décrit (ags:descriptionEdition), ou dun résumé permettant au lecteur davoir une idée plus précise du contenu de celui-ci (dcterms:abstract).
Modèle de contenu XML |
(ags:descriptionNotes | ags:descriptionEdition | dcterms:abstract)* |
|
Balise XML |
<dc:description> |
|
Attributs/schémas XML |
dcterms:abstract |
Facultatif |
Ce champ est réservé aux identifiants, cest-à-dire aux numéros standardisés, figurant sur le document et permettant de le localiser et/ou de lidentifier. Plusieurs numéros peuvent être attribués à un document. Certains numéros peuvent être saisis à laide dune formulation officiellement reconnue. Pour les ressources électroniques, lURI (adresse électronique commençant par http:// ou ftp://) est également indiquée dans ce champ. Les numéros attribués par des organismes de catalogage pour des raisons de fonctionnement interne ne sont pas indiqués ici, mais dans le champ agls:availability.
Modèle de contenu XML |
dc:identifier (#PCDATA) |
|
Balise XML |
<dc:identifier
scheme="ags:DOI">DOI
id</dc:identifier> |
|
Attributs/schémas XML |
scheme (ags:IPC | ags:RN | ags:PN | ags:ISBN | ags:JN | dcterms:URI | ags:DOI) |
Facultatif |
Bien que cela ne soit pas obligatoire, il est recommandé de fournir la valeur de cet élément lorsque cela est possible. Ce champ décrit la nature ou le genre du contenu de la ressource. Il inclut également des termes qui aident à décrire des catégories, des fonctions, des genres généraux pour le contenu, ou des niveaux dagrégation.
Il est recommandé de choisir les valeurs dc:type dans la Liste de types du DCMI[13]. En cas dutilisation dun vocabulaire contrôlé local, ne pas insérer de code mais décrire le genre du document par des mots entiers.
Modèle de contenu XML |
dc:type (#PCDATA) |
|
Balise XML |
<dc:type>DC Types controlled vocabularies</dc:type> |
|
Attributs/schémas XML schemes |
scheme (dcterms:DCMIType) |
Facultatif |
Lélément Taille (dcterms:extent) décrit la dimension ou la durée dune ressource tandis que lélément Média (dcterms:medium) en décrit le support physique ou matériel.
Modèle de contenu XML |
dc:format (dcterms:extent | dcterms:medium)* |
|
Balise XML |
<dc:format> |
|
Attributs/schémas XML |
- |
|
Il est recommandé dutiliser le code à trois lettres spécifié dans la norme ISO639-2[14] pour indiquer la langue de rédaction du document. Si la langue nest pas répertoriée, saisissez son nom en entier sans indiquer de schéma.
Modèle de contenu XML |
dc:language (#PCDATA) |
|
Balise XML |
<dc:language scheme="ISO639-1">language of resource</dc:language> |
|
Attributs/schémas XML |
scheme (ISO639-1 | ISO639-2) |
Facultatif |
Cet élément sert à établir la relation dune ressource à une autre et permet aux utilisateurs de localiser des ressources connexes. Il est important détablir le type de relation en choisissant une valeur dans lune des paires suivantes des types de raffinement de relation.
La disponibilité indique aux utilisateurs le numéro ou le code attribué de façon unique à un document et permet didentifier ce document au sein dune organisation. Ce numéro est généralement attribué par lorganisation qui est en possession du document. Cette information étant locale, la disponibilité doit spécifier le nom ou le code didentification de linstitution ou du centre (ags:availabilityLocation), la localisation du document ainsi que le numéro daccès local (ags:availabilityNumber).
Modèle de contenu XML |
agls:availability (ags:availabilityLocation, ags:availabilityNumber)* |
|
Balise XML |
<agls:availability> |
|
Attributs/schémas XML |
- |
|
Il sagit dune référence à une ressource à partir de laquelle la présente ressource est dérivée. Lors du catalogage du niveau analytique, cet élément est utilisé pour fournir les informations nécessaires à lidentification dune monographie. Les informations que lon peut inclure dans ce champ sont le titre dun ensemble, lauteur, etc.
Modèle de contenu XML |
dc:source (#PCDATA) |
|
Balise XML |
<dc:source>additional information of resource</dc:source> |
|
Attributs/schémas XML |
- |
|
Cet élément fournit des informations sur la couverture géographique (dc:spatial) et temporelle (dc:temporal) de la ressource.
Modèle de contenu XML |
dc:coverage (#PCDATA, dc:spatial, dc:temporal) |
|
Balise XML |
<dc:coverage>additional
information of resource |
|
Attributs/schémas XML |
dcterms:spatial |
Facultatif Facultatif |
Modèle de contenu XML |
dc:rights (#PCDATA, ags:rightsStatement, ags:rightsTermsOfUse) |
|
Balise XML |
<dc:rights> |
|
Attributs/schémas XML |
|
|
Ce champ doit être rempli lorsque le document fait partie dun publication en série, cest-à-dire dune publication, ayant un ordre numérique ou chronologique, dont la parution est prévue pendant une période non déterminée. Elle peut se présenter sous une forme quelconque et être publiée en plusieurs parties successives.
Modèle de contenu XML |
ags:citation (ags:citationTitle | ags:citationIdentifier | ags:citationNumber | ags:citationChronology)* |
|
Balise XML |
<ags:citation> |
|
Attributs/schémas XML |
ags:citationTitle |
Facultatif Obligatoire |
[11] Voir l'Annexe B pour un
exemple de document conforme au XML PA AGRIS. [12] Pour connaître les codes des noms de langue, voir http://www.loc.gov/standards/iso639-2/langcodes.html [13] http://dublincore.org/documents/dcmi-type-vocabulary [14] Codes en trois lettres ISO639-2 (langue) http://www.loc.gov/standards/iso639-2/langcodes.html |