Page précédente Table des matières Page suivante


4. Ecriture du XML


4.1 En tête des fichiers XML[11]

La DTD AGRIS fournit un ensemble d’éléments, de raffinements et de schémas qui permettent de décrire et de former la structure constituant le format XML d’un enregistrement bibliographique. Il est indispensable, lors de la création ou de l’exportation de documents XML conformes au PA AGRIS, de joindre l’en-tête figurant ci-après.

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE ags:resources SYSTEM "http://purl.org/agmes/agrisap/dtd/">
<ags:resources xmlns:ags="http://purl.org/agmes/1.1/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:agls="http://www.naa.gov.au/recordkeeping/gov_online/agls/1.2"
xmlns:dcterms="http://purl.org/dc/terms/">

4.1.1 Déclaration XML

Tous les documents XML doivent déclarer qu’ils sont des documents XML en insérant la déclaration XML ci-après:

<?xml version="1.0" encoding="UTF-8"?>

Cette ligne indique au logiciel recevant le fichier de données XML que le langage utilisé est le XML et que le fichier est conforme à la spécification XML, version 1.0. La question du codage est abordée ultérieurement. Cette ligne ne constitue pas vraiment une balise XML contenant des données et il n’est donc pas nécessaire d’insérer une balise de fermeture. Cette ligne doit être placée au début du document

4.1.2 Déclaration de type de document

Lorsque l’on balise un document avec une DTD, il est d’usage d’inclure une déclaration DOCTYPE afin que les outils de traitement «sachent» à quelle DTD se conforme le document traité. Lorsqu’un parseur valide un document XML par rapport à une DTD, le document est contrôlé pour vérifier que tous les éléments requis sont présents et qu’aucun élément non déclaré n’a été ajouté. La structure hiérarchique des éléments définis dans la DTD doit être conservée Les valeurs de tous les attributs seront vérifiées pour s’assurer qu’elles correspondent aux recommandations. En résumé, tous les détails du document XML, du début à la fin, seront définis et validés par la DTD. La vérification de l’uniformité entre les groupes de documents XML, tels que ceux collectés par le service d’archivage AGRIS à partir de centres répartis dans le monde entier, est ainsi simplifiée.

<!DOCTYPE ags:resources SYSTEM "http://purl.org/agmes/agrisap/dtd/">

La déclaration DOCTYPE ci-dessus relative à un document AGRIS balisé à l’aide de la DTD AGRIS indique que le type de document est ags:resources et qu’il est conforme à la DTD. Le fait d’exiger qu’un document XML soit validé par rapport à la DTD AGRIS permet de garantir l’intégrité de la structure des données. Les documents XML peuvent être parsés et validés antérieurement à leur chargement par l’application.

Cette déclaration renvoie à un localisateur persistant de ressources uniformes (PURL), ce qui facilite la validation, à condition que l’ordinateur soit connecté à Internet. Si ce n’est pas le cas, utilisez la DTD figurant en annexe.

4.1.3 Déclaration d’espaces de nom

Les déclarations d’espaces de nom se placent après la référence DTD XML. Étant donné que les documents peuvent contenir plusieurs espaces de nom et qu’il existe un risque de collision entre préfixes, les espaces de nom permettent aux développeurs d’établir une correspondance entre les préfixes et les URI pour les éléments et leur contenu, sans se limiter au document.

<ags:resources

xmlns:ags="http://purl.org/agmes/1.1/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:agls="http://www.naa.gov.au/recordkeeping/gov_online/agls/1.2">

L’exemple ci-dessus contient quatre déclarations d’espaces de nom: ags, dc, dcterms et agls. En général, un espace de nom définit de façon unique un ensemble de noms ou de balises; on évite ainsi toute équivoque lorsque des balises de différentes origines, mais portant les mêmes noms, sont mélangées. Ainsi, dcterms:citation est différent de ags:citation.

4.2 Éléments et schémas obligatoires

Les structures suivantes sont utilisées pour décrire la classe “AGRIS” de documents: Text only (dc:type, dc:source, etc.), Element only (dc:citation, agls:availability, etc.) et Mixed content (dc:title or dc:relation). Text only n’est utilisé que pour du texte; Element only, que pour des éléments et Mixed content, pour un contenu mixte. Tous les attributs sont des chaînes de données textuelles (CDATA), à l’exception de ags:ARN, qui est un identifiant unique pour l’élément racine ags:resource (ID), et de l’attribut réservé xml:lang qui, lorsqu’appliqué, doit être restreint aux trois lettres du code langue ISO639-2[12].

A l’intérieur de la DTD, la cardinalité des éléments est indiquée par les opérateurs de cardinalité suivants.

(Pas d’indicateur)

Obligatoire

Un et un seul

+

Obligatoire, Répétable

Un ou plus

?

Facultatif

Aucun ou un

*

FacultatifRépétable

Aucun, un ou plus

4.3 Corps XML du document

Cette section explique comment coder chaque élément, raffinement et schéma pour créer des éléments XML bien formés. Chaque tableau décrit le modèle de contenu de l’élément. Le modèle indique comment baliser le contenu et les attributs, et précise son caractère obligatoire ou facultatif.

4.3.1 Attribut ags:ARN

Cet attribut remplace le champ AGRIS précédent pour le numéro d’enregistrement provisoire (TRN, Temporary Record Number). Il possède une contrainte de validité d’identité qui confère l’unicité à une ressource AGRIS. Il est donc primordial, pour différencier deux enregistrements, d’utiliser un système unique de numérotation. L’ARN est obligatoire pour toute entrée soumise à AGRIS. Le format utilisé pour cet attribut est constitué de 12 caractères, divisés en quatre groupes. Un ARN contient généralement:

a) le code du pays, en deux lettres, répondant à la norme ISO. Il s’agit du code de pays du centre de ressources AGRIS ou du code de l’institution multinationale ou internationale ayant préparé l’entrée. La liste des codes géographiques des centres AGRIS figure dans le standard ISO3166-1. Les codes AGRIS utilisés aujourd’hui par les centres sont spécifiés dans l’annexe C du guide de l’utilisateur du PA AGRIS ou sur le site web AGRIS;

b) l’année durant laquelle l’entrée est préparée. Elle se compose de quatre chiffres et ne doit pas être confondue avec l’année de publication du document;

c) le sous-code attribué par le centre de ressources (1 caractère seulement). Ce sous-code est utilisé par les pays ayant plus d’un centre de préparation des entrées pour AGRIS. Il ne comporte qu’un seul caractère (une lettre ou un chiffre). Pour les pays qui ont plus de neuf sous-centres, il peut s’agir d’une lettre. Pour les pays qui n’ont qu’un seul centre de préparation et de soumission des entrées, la case comportera un zéro (0);

d) un numéro composé de cinq chiffres. Ce chiffre est attribué par le centre participant à chaque année ou représente un numéro local de classification, tel qu’un numéro interne d’une bibliothèque. Exemple:

4.3.2 Élément racine ags:resource

ags:resource est l’élément racine et contient tous les autres éléments fondamentaux et les qualificatifs. Cinq éléments fondamentaux sont obligatoires: le titre, la date, le sujet, la langue et la disponibilité. Il s’agit de l’élément le plus important dans la mesure où il contient le reste du document et devient synonyme du type de document.

Modèle de contenu XML

(dc:title+, dc:creator*, dc:publisher*, dc:date+, dc:subject+, dc:description*, dc:identifier*, dc:type*, dc:format*, dc:language+, dc:relation*, agls:availability+, dc:source?, dc:coverage*, dc:rights*, ags:citation*)

Balise XML

<ags:resource ags:ARN="XF2004000244"> </ags:resource>

Attributs/schémas XML

ags:ARN (voir 4.3.1).

Obligatoire

4.3.3 Élément dc:title

Ce champ sert à indiquer le titre du document et le cas échéant, sa traduction (dcterms:alternative).

Modèle de contenu XML

(#PCDATA | dcterms:alternative)*

Balise XML

<dc:title xml:lang="eng">title of resource
<dcterms:alternative xml:lang="eng">other title, normally translated </dcterms:alternative>
</dc:title>

Attributs/schémas XML

xml:lang

Obligatoire

4.3.4 Élément dc:creator

Cet élément décrit toutes les entités (Agents) responsables du contenu intellectuel d’une ressource documentaire et indique parfois la contribution de chaque créateur à la ressource. Il peut s’agit de d’une personne (ags:creatorPersonal), d’une organisation, d’un service ou d’un organisme (ags:creatorCorporate), ou bien encore d’une réunion (ags:creatorConference).

Modèle de contenu XML

(ags:creatorPersonal | ags:creatorCorporate | ags:creatorConference)*

Balise XML

<dc:creator>
<ags:creatorPersonal>personal creator</ags:creatorPersonal>
<ags:creatorCorporate>corporate creator</ags:creatorCorporate>
<ags:creatorConference>conference creator</ags:creatorConference>
</dc:creator>

Attributs/schémas XML

-


4.3.5 Élément dc:publisher

Cet élément se compose de deux raffinements et renseigne sur l’éditeur. Il indique le nom de la personne, du groupe ou de l’organisation contrôlant ou publiant le document (ags:publisherName) et le lieu de publication (ags:publisherPlace).

Modèle de contenu XML

(ags:publisherName | ags:publisherPlace)*

Balise XML

<dc:publisher>
<ags:publisherName>name of publisher</ags:publisherName>
<ags:publisherPlace>location of publisher</ags:publisherPlace>
</dc:publisher>

Attributs/schémas XML

-


4.3.6 Élément dc:date

Cet élément indique la date de mise à disposition du document et doit être accompagné de son qualificatif (dcterms:dateIssued).

Modèle de contenu XML

dc:date (dcterms:dateIssued)

Balise XML

<dc:date>
<dcterms:dateIssued>date of publ.</dcterms:dateIssued >
</dc:date>

Attributs/schémas XML

scheme (dcterms:W3CDTF)


4.3.7 Élément dc:subject

Ce champ est utilisé pour indiquer le sujet du document. Il peut s’agir d’un texte libre (dc:subject), ou être indexé à partir d’un plan de classification (ags:subjectClassification) ou d’un vocabulaire contrôlé (ags:subjectThesaurus).

Modèle de contenu XML

(#PCDATA | ags:subjectClassification | ags:subjectThesaurus)*

Balise XML

<dc:subject>
<ags:subjectClassification scheme="ags:ASC">ASC scheme</ags:subjectClassification>
<ags:subjectClassification scheme="ags:CABC">CABC scheme</ags:subjectClassification>
<ags:subjectClassification scheme="dcterms:DDC">DDC scheme</ags:subjectClassification>
<ags:subjectClassification scheme="dcterms:LCC">LCC scheme</ags:subjectClassification>
<ags:subjectClassification scheme="dcterms:UDC">UDC scheme</ags:subjectClassification>
</dc:subject>
<dc:subject>
<
ags:subjectThesaurus scheme="ags:AGROVOC" xml:lang="eng">AGROVOC term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="ags:ASFAT" xml:lang="eng">ASFAT term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="ags:CABT" xml:lang="eng">CABT term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="ags:NALT" xml:lang="eng">NALT term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="dcterms:LCSH" xml:lang="eng">LCSH term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="dcterms:MeSH" xml:lang="eng">MeSH term</ags:subjectThesaurus>
</dc:subject>

Attributs/schémas XML

ags:subjectClassification
scheme (ags:ASC | ags:CABC | dcterms:DDC | dcterms:LCC | dcterms:UDC)
ags:subjectThesaurus
scheme (ags:CABT | ags:AGROVOC | ags:NALT | ags:ASFAT | dcterms:LCSH | dcterms:MeSH)
xml:lang

Obligatoire

Obligatoire

Obligatoire

4.3.8 Élément dc:description

Cet élément sert à décrire le document. Il peut s’agir d’un texte concis, d’une annotation, d’un commentaire ou d’un éclaircissement relatifs à un quelconque aspect du document (ags:descriptionNotes), d’une version officielle de la série de données ou du document décrit (ags:descriptionEdition), ou d’un résumé permettant au lecteur d’avoir une idée plus précise du contenu de celui-ci (dcterms:abstract).

Modèle de contenu XML

(ags:descriptionNotes | ags:descriptionEdition | dcterms:abstract)*

Balise XML

<dc:description>
<ags:descriptionEdition>description of edition</ags:descriptionEdition>
<ags:descriptionNotes>notes</ags:descriptionNotes>
<dcterms:abstract xml:lang="eng">abstract</dcterms:abstract>
</dc:description>

Attributs/schémas XML

dcterms:abstract
xml:lang

Facultatif

4.3.9 Élément dc:identifier

Ce champ est réservé aux identifiants, c’est-à-dire aux numéros standardisés, figurant sur le document et permettant de le localiser et/ou de l’identifier. Plusieurs numéros peuvent être attribués à un document. Certains numéros peuvent être saisis à l’aide d’une formulation officiellement reconnue. Pour les ressources électroniques, l’URI (adresse électronique commençant par http:// ou ftp://) est également indiquée dans ce champ. Les numéros attribués par des organismes de catalogage pour des raisons de fonctionnement interne ne sont pas indiqués ici, mais dans le champ agls:availability.

Modèle de contenu XML

dc:identifier (#PCDATA)

Balise XML

<dc:identifier scheme="ags:DOI">DOI id</dc:identifier>
<dc:identifier scheme="ags:IPC">International Patent Classification no.</dc:identifier>
<dc:identifier scheme="ags:ISBN">Book ISBN</dc:identifier>
<dc:identifier scheme="ags:JN">Job Number</dc:identifier>
<dc:identifier scheme="ags:PN">Patent Number</dc:identifier>
<dc:identifier scheme="ags:RN">Report Number</dc:identifier>
<dc:identifier scheme="dcterms:URI">URI of resource</dc:identifier>

Attributs/schémas XML

scheme (ags:IPC | ags:RN | ags:PN | ags:ISBN | ags:JN | dcterms:URI | ags:DOI)

Facultatif

4.3.10 Élément dc:type

Bien que cela ne soit pas obligatoire, il est recommandé de fournir la valeur de cet élément lorsque cela est possible. Ce champ décrit la nature ou le genre du contenu de la ressource. Il inclut également des termes qui aident à décrire des catégories, des fonctions, des genres généraux pour le contenu, ou des niveaux d’agrégation.

Il est recommandé de choisir les valeurs dc:type dans la Liste de types du DCMI[13]. En cas d’utilisation d’un vocabulaire contrôlé local, ne pas insérer de code mais décrire le genre du document par des mots entiers.

Modèle de contenu XML

dc:type (#PCDATA)

Balise XML

<dc:type>DC Types controlled vocabularies</dc:type>

Attributs/schémas XML schemes

scheme (dcterms:DCMIType)

Facultatif

4.3.11 Élément dc:format

L’élément Taille (dcterms:extent) décrit la dimension ou la durée d’une ressource tandis que l’élément Média (dcterms:medium) en décrit le support physique ou matériel.

Modèle de contenu XML

dc:format (dcterms:extent | dcterms:medium)*

Balise XML

<dc:format>
<dcterms:extent>collation, size, duration of the resource</dcterms:extent>
<dcterms:medium> the material or physical carrier of the resource. </dcterms:medium>
</dc:format>

Attributs/schémas XML

-


4.3.12 Élément dc:language

Il est recommandé d’utiliser le code à trois lettres spécifié dans la norme ISO639-2[14] pour indiquer la langue de rédaction du document. Si la langue n’est pas répertoriée, saisissez son nom en entier sans indiquer de schéma.

Modèle de contenu XML

dc:language (#PCDATA)

Balise XML

<dc:language scheme="ISO639-1">language of resource</dc:language>

Attributs/schémas XML

scheme (ISO639-1 | ISO639-2)

Facultatif

4.3.13 Élément dc:relation

Cet élément sert à établir la relation d’une ressource à une autre et permet aux utilisateurs de localiser des ressources connexes. Il est important d’établir le type de relation en choisissant une valeur dans l’une des paires suivantes des types de raffinement de relation.

Modèle de contenu XML

(#PCDATA | dcterms:isPartOf | dcterms:hasPart | dcterms:isVersionOf | dcterms:hasVersion | dcterms:isFormatOf | dcterms:hasFormat | dcterms:references | dcterms:isReferencedBy | dcterms:isRequiredBy | dcterms:requires | dcterms:isReplacedBy | dcterms:replaces | ags:relationHasTranslation | ags:relationIsTranslationOf)*

Balise XML

(only dcterms:URI scheme included for each qualifier)

<!-- physical or logical part of the referenced resource -->
<dc:relation>
<dcterms:isPartOf scheme="dcterms:URI">related URI</dcterms:isPartOf>
</dc:relation>
<!-- the referenced resource either physically or logically -->
<dc:relation>
<dcterms:hasPart scheme="dcterms:URI">related URI</dcterms:hasPart>
</dc:relation>
<!-- a version, edition, or adaptation of the referenced resource. Changes in version imply substantive changes in content rather than differences in format -->
<dc:relation>
<dcterms:isVersionOf scheme="dcterms:URI">related URI</dcterms:isVersionOf>
</dc:relation>
<!-- a version, edition, or adaptation, namely, the referenced resource -->
<dc:relation>
<dcterms:hasVersion scheme="dcterms:URI">related URI</dcterms:hasVersion>
</dc:relation>
<!-- same intellectual content of the referenced resource, but presented in another format-->
<dc:relation>
<dcterms:isFormatOf scheme="dcterms:URI">related URI</dcterms:isFormatOf>
</dc:relation>
<!-- pre-existed the referenced resource, which is essentially the same intellectual content presented in another format -->
<dc:relation>
<dcterms:hasFormat scheme="dcterms:URI">related URI</dcterms:hasFormat>
</dc:relation>
<!-- references, cites, or otherwise points to the referenced resource -->
<dc:relation>
<dcterms:references scheme="dcterms:URI">related URI</dcterms:references>
</dc:relation>
<!-- is referenced, cited, or otherwise pointed to by the referenced resource -->
<dc:relation>
<dcterms:isReferencedBy scheme="dcterms:URI">related URI</dcterms:isReferencedBy>
</dc:relation>
<!-- is required by the referenced resource, either physically or logically -->
<dc:relation>
<dcterms:isRequiredBy scheme="dcterms:URI">related URI</dcterms:isRequiredBy>
</dc:relation>
<!-- required by the referenced resource, either physically or logically -->
<dc:relation>
<dcterms:requires scheme="dcterms:URI">related URI</dcterms:requires>
</dc:relation>
<!-- is supplanted, displaced, or superseded by the referenced resource -->
<dc:relation>
<dcterms:isReplacedBy scheme="dcterms:URI">related URI</dcterms:isReplacedBy>
</dc:relation>
<!-- supplants, displaces, or supersedes the referenced resource -->
<dc:relation>
<dcterms:replaces scheme="dcterms:URI">related URI</dcterms:replaces>
</dc:relation>
<!-- has a translation, namely, the referenced resource -->
<dc:relation>
<ags:relationHasTranslation scheme="dcterms:URI">related URI</ags:relationHasTranslation>
</dc:relation>
<!-- a translation of the referenced resource -->
<dc:relation>
<ags:relationIsTranslationOf scheme="dcterms:URI">related URI</ags:relationIsTranslationOf>
</dc:relation>

Attributs/schémas XML

scheme (ags:IPC | ags:PN | ags:ISBN | ags:JN | dcterms:URI | ags:ARN)

Obligatoire

4.3.14 Élément agls:availability

La disponibilité indique aux utilisateurs le numéro ou le code attribué de façon unique à un document et permet d’identifier ce document au sein d’une organisation. Ce numéro est généralement attribué par l’organisation qui est en possession du document. Cette information étant locale, la disponibilité doit spécifier le nom ou le code d’identification de l’institution ou du centre (ags:availabilityLocation), la localisation du document ainsi que le numéro d’accès local (ags:availabilityNumber).

Modèle de contenu XML

agls:availability (ags:availabilityLocation, ags:availabilityNumber)*

Balise XML

<agls:availability>
<ags:availabilityLocation>availability location</ags:availabilityLocation>
<ags:availabilityNumber>availability number</ags:availabilityNumber>
</agls:availability>

Attributs/schémas XML

-


4.3.15 Élément dc:source

Il s’agit d’une référence à une ressource à partir de laquelle la présente ressource est dérivée. Lors du catalogage du niveau analytique, cet élément est utilisé pour fournir les informations nécessaires à l’identification d’une monographie. Les informations que l’on peut inclure dans ce champ sont le titre d’un ensemble, l’auteur, etc.

Modèle de contenu XML

dc:source (#PCDATA)

Balise XML

<dc:source>additional information of resource</dc:source>

Attributs/schémas XML

-


4.3.16 Élément dc:coverage

Cet élément fournit des informations sur la couverture géographique (dc:spatial) et temporelle (dc:temporal) de la ressource.

Modèle de contenu XML

dc:coverage (#PCDATA, dc:spatial, dc:temporal)

Balise XML

<dc:coverage>additional information of resource
<dcterms:spatial scheme ="dcterms:ISO3166">coverage (ISO3166)</dcterms:spatial>
<dcterms:temporal scheme ="dcterms:TGN">coverage (TGN)</dcterms: temporal >
</dc:coverage>

Attributs/schémas XML

dcterms:spatial
scheme (dcterms:POINT | dcterms:ISO3166 | dcterms:TGN | dcterms:Box)
dcterms:temporal
scheme (dcterms:Period | dcterms: W3CDTF)

Facultatif

Facultatif

4.3.17 Élément dc:rights

Modèle de contenu XML

dc:rights (#PCDATA, ags:rightsStatement, ags:rightsTermsOfUse)

Balise XML

<dc:rights>
<
ags:rightsStatement>statements of rights</ags:rightsStatement>
<
ags:rightsTermsOfUse>terms of use<ags:rightsTermsOfUse>
</
dc:rights>

Attributs/schémas XML



4.3.18 Élément ags:citation

Ce champ doit être rempli lorsque le document fait partie d’un publication en série, c’est-à-dire d’une publication, ayant un ordre numérique ou chronologique, dont la parution est prévue pendant une période non déterminée. Elle peut se présenter sous une forme quelconque et être publiée en plusieurs parties successives.

Modèle de contenu XML

ags:citation (ags:citationTitle | ags:citationIdentifier | ags:citationNumber | ags:citationChronology)*

Balise XML

<ags:citation>
<ags:citationTitle>Title of the serial</ags:citationTitle>
<ags:citationIdentifier scheme="ags:ISSN"> Identifier of the Serial </ags:citationIdentifier>
<ags:citationNumber>Number of the issue</ags:citationNumber>
<ags:citationChronology>Chronological designation of the issue</ags:citationChronology>
</ags:citation>

Attributs/schémas XML

ags:citationTitle
xml:lang
ags:citationIdentifier
scheme (ags:ISSN | ags:CODEN)

Facultatif

Obligatoire


[11] Voir l'Annexe B pour un exemple de document conforme au XML PA AGRIS.
[12] Pour connaître les codes des noms de langue, voir http://www.loc.gov/standards/iso639-2/langcodes.html
[13] http://dublincore.org/documents/dcmi-type-vocabulary
[14] Codes en trois lettres ISO639-2 (langue) http://www.loc.gov/standards/iso639-2/langcodes.html

Page précédente Début de page Page suivante