Página precedente Indice Página siguiente


4. Escribir en XML[11]


4.1 Encabezado de los archivos XML

La DTD del AGRIS ofrece una serie de elementos, refinaciones y esquemas para describir y aplicar la estructura que constituye el formato XML de los registros bibliográficos. Es esencial, al crear o exportar documentos en XML adecuados para el AGRIS AP, añadir el siguiente encabezado:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE ags:resources SYSTEM "http://purl.org/agmes/agrisap/dtd/">
<ags:resources xmlns:ags="http://purl.org/agmes/1.1/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:agls="http://www.naa.gov.au/recordkeeping/gov_online/agls/1.2"
xmlns:dcterms="http://purl.org/dc/terms/">

4.1.1 Declaración de XML

Todos los documentos en XML deben declarar que son documentos XML de la siguiente manera:

<?xml version="1.0" encoding="UTF-8"?>

Esta línea indica al programa que recibe un archivo de datos en XML, que se está escribiendo en XML y que debe corresponder el archivo a la especificación XML de la versión 1.0. Más adelante se trata el tema de la codificación. Como no es una etiqueta XML que contenga datos, no necesita una etiqueta de cierre y debe estar al principio del documento.

4.1.2 Declaración del tipo de documento

Al marcar documentos con una DTD, se incluye una declaración DOCTYPE para que los instrumentos de tratamiento "sepan" a cuál DTD se conforma el documento que se está tratando. Al validarse un documento XML frente a la DTD mediante la validación del analizador sintáctico XML, el documento en XML se verificará para asegurar que estén presentes todos los elementos necesarios y que no se hayan añadido elementos que no estén declarados. La estructura jerárquica de los elementos definidos en la DTD debe mantenerse. Los valores de todos los atributos se verificarán para asegurar que cumplan con las directrices establecidas. En pocas palabras, todos los detalles del documento en XML, de principio a fin, se validarán a través de la DTD. Esto facilita el proceso de garantizar la uniformidad entre los grupos de documentos XML, como los que extrae el depósito del AGRIS de los distintos centros de todo el mundo.

<!DOCTYPE ags:resources SYSTEM "http://purl.org/agmes/agrisap/dtd/">

La declaración DOCTYPE que figura arriba, de un documento del AGRIS, marcada con la DTD del AGRIS, indica que el tipo de documento es ags:resources y que cumple con la DTD. La exigencia de que los documentos XML se validen ante la DTD del AGRIS asegura la integridad de la estructura de los datos. Los documentos XML se pueden analizar sintácticamente antes de que una aplicación los cargue.

Esta declaración indica una PURL (localizador de recursos uniforme y continuo), que facilita la validación, siempre que la computadora esté conectada a Internet. En caso contrario, la DTD que figura en el apéndice debería utilizarse para validar e documento XML.

4.1.3 Declaración de los espacios de nombres

Las declaraciones del espacio de nombre debe ser la siguiente línea de la referencia a la DTD XML. Debido a que los documentos contienen múltiples espacios de nombres y dada la posibilidad de que choquen los prefijos, los espacios de nombres permiten a los programadores mapear los prefijos en las URL por los elementos y su contenido, y no sólo en los documentos.

<ags:resources

xmlns:ags="http://purl.org/agmes/1.1/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:agls="http://www.naa.gov.au/recordkeeping/gov_online/agls/1.2">

En el ejemplo de arriba hay cuatro declaraciones de espacios de nombres: ags, dc, dcterms y agls. En general, un espacio de nombre identifica exclusivamente un conjunto de nombres o etiquetas, de modo que no haya ambigüedad cuando se mezclan etiquetas de distinto origen pero con los mismos nombres. De esta manera, dcterms:citation es diferente de ags:citation.

4.2 Elementos y esquemas obligatorios

Las estructuras utilizadas para describir la clase de documentos "AGRIS" son sólo texto (dc:type, dc:source, etc.), sólo elemento (dc:citation, agls:availability, etc.) y contenido mixto (dc:title o dc:relation). Todos los atributos son cadenas de caracteres de datos (CDATA), con excepción de ags:ARN, que es un identificador único para el elemento raíz ags:resource (ID) y el atributo reservado xml:lang que, donde se aplica, debe limitarse a el código de idioma de tres letras ISO639-2.[12]

En la DTD, se indica la cardinalidad de los elementos con los siguientes operadores de cardinalidad.

(sin indicador)

Obligatorio

Uno y sólo uno

+

Obligatorio, repetible

Uno o más

?

Opcional

Ninguno o uno

*

Opcional, repetible

Ninguno, uno o más

4.3 El documento en XML

Esta sección explica cómo codificar cada elemento, refinación y esquema para crear elementos bien formados en XML. Cada cuadro describe el modelo de contenido del elemento, una plantilla que explica cómo se debe etiquetar el documento, los atributos y si el atributo es necesario.

4.3.1 Atributo ags:ARN

Este atributo sustituye el anterior campo AGRIS correspondiente al número temporal de registro (TRN). Tiene una limitación de validez de ID que da exclusividad a los recursos del AGRIS. Por lo tanto, es esencial utilizar un sistema de numeración exclusivo para distinguir entre dos registros. El ARN es obligatorio para todos los registros presentados al AGRIS El formato utilizado para este atributo obligatorio consta de 12 caracteres, divididos en cuatro grupos. Los ARN contienen:

a) el código de país de dos letras del ISO donde está el centro de recursos del AGRIS para el código de la institución multinacional o internacional que aporta la colaboración. Esta lista se puede encontrar en el ISO3166-1, con los códigos geográficos. Los códigos del AGRIS que están utilizando actualmente los centros figuran en el apéndice C de la Guía para el usuario del AGRIS AP, o en el portal del AGRIS;

b) el año en que se crea el registro aportado. Debe constar de cuatro dígitos y no es el año de publicación del recurso;

c) el código del subcentro asignado por el centro de recursos, un sólo carácter, utilizado en los países que tienen más de un centro de recursos. Puede ser una letra o un dígito. En los países donde hay más de nueve subcentros, el código del subcentro puede ser una letra. En los países que sólo tienen un centro de recursos se debe anotar un cero (0) en este campo;

d) un número compuesto de cinco dígitos. Se puede asignar anualmente o puede ser un número de clasificación local, como un número interno de la biblioteca. Por ejemplo:

4.3.2 Elemento ags:resource

Este es el elemento raíz y contiene todos los demás elementos y calificadores centrales. Cinco de los elementos centrales son obligatorios, es decir: el título, la fecha, el tema, el idioma y la información de disponibilidad. Es el elemento más importante porque contiene el resto del documento y se vuelve sinónimo del tipo de documento.

XML content model

(dc:title+, dc:creator*, dc:publisher*, dc:date+, dc:subject+, dc:description*, dc:identifier*, dc:type*, dc:format*, dc:language+, dc:relation*, agls:availability+, dc:source?, dc:coverage*, dc:rights*, ags:citation*)

XML tag

<ags:resource ags:ARN="XF2004000244"> </ags:resource>

XML attributes/
schemes

ags:ARN (voir 4.3.1).

necesario

4.3.3 Elemento dc:title

Anotar en este elemento el título del documento. Si existe, anotar también el título de la traducción del recurso (dcterms:alternative).

XML content model

(#PCDATA | dcterms:alternative)*

XML tag

<dc:title xml:lang="eng">title of resource
<dcterms:alternative xml:lang="eng">other title, normally translated </dcterms:alternative>
</dc:title>

XML attributes/
schemes

xml:lang

necesario

4.3.4 Elemento dc:creator

Este elemento describe todas las entidades (agentes) que manejan el recurso, es decir, lo crean o aportan. Pueden ser una persona (ags:creatorPersonal), una organización, una dependencia o agencia (ags:creatorCorporate); o una conferencia (ags:creatorConference).

XML content model

(ags:creatorPersonal | ags:creatorCorporate | ags:creatorConference)*

XML tag

<dc:creator>
<ags:creatorPersonal>personal creator</ags:creatorPersonal>
<ags:creatorCorporate>corporate creator</ags:creatorCorporate>
<ags:creatorConference>conference creator</ags:creatorConference>
</dc:creator>

XML attributes/
schemes

-


4.3.5 Elemento dc:publisher

Anotar en dos elementos de refinación la información del editor. Estos elementos presentan el nombre de la persona, el grupo o la organización que controla o publica el elemento (ags:publisherName), y su ubicación (ags:publisherPlace).

XML content model

(ags:publisherName | ags:publisherPlace)*

XML tag

<dc:publisher>
<ags:publisherName>name of publisher</ags:publisherName>
<ags:publisherPlace>location of publisher</ags:publisherPlace>
</dc:publisher>

XML attributes/
schemes

-


4.3.6 Elemento dc:date

Anotar en este elemento la fecha de publicación del recurso. Este elemento, dc:date, se debe utilizar con su calificador (dcterms:dateIssued).

XML content model

dc:date (dcterms:dateIssued)

XML tag

<dc:date>
<dcterms:dateIssued>date of publ.</dcterms:dateIssued >
</dc:date>

XML attributes/
schemes

scheme (dcterms:W3CDTF)


4.3.7 Elemento dc:subject

Anotar en este elemento la información del tema sobre el recurso. Puede ser texto libre (dc:subject), proceder de un esquema de clasificación (ags:subjectClassification) o de un vocabulario controlado (ags:subjectThesaurus).

XML content model

(#PCDATA | ags:subjectClassification | ags:subjectThesaurus)*

XML tag

<dc:subject>
<ags:subjectClassification scheme="ags:ASC">ASC scheme</ags:subjectClassification>
<ags:subjectClassification scheme="ags:CABC">CABC scheme</ags:subjectClassification>
<ags:subjectClassification scheme="dcterms:DDC">DDC scheme</ags:subjectClassification>
<ags:subjectClassification scheme="dcterms:LCC">LCC scheme</ags:subjectClassification>
<ags:subjectClassification scheme="dcterms:UDC">UDC scheme</ags:subjectClassification>
</dc:subject>
<dc:subject>
<
ags:subjectThesaurus scheme="ags:AGROVOC" xml:lang="eng">AGROVOC term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="ags:ASFAT" xml:lang="eng">ASFAT term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="ags:CABT" xml:lang="eng">CABT term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="ags:NALT" xml:lang="eng">NALT term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="dcterms:LCSH" xml:lang="eng">LCSH term</ags:subjectThesaurus>
<ags:subjectThesaurus scheme="dcterms:MeSH" xml:lang="eng">MeSH term</ags:subjectThesaurus>
</dc:subject>

XML attributes/
schemes

ags:subjectClassification
scheme (ags:ASC | ags:CABC | dcterms:DDC | dcterms:LCC | dcterms:UDC)
ags:subjectThesaurus
scheme (ags:CABT | ags:AGROVOC | ags:NALT | ags:ASFAT | dcterms:LCSH | dcterms:MeSH)
xml:lang

required

required

required

4.3.8 Elemento dc:description

Este elemento indica diferentes aspectos descriptivos del recurso. Éstos pueden incluir una breve exposición, anotación, comentario o reflexión sobre cualquier aspecto del recurso (ags:descriptionNotes); la versión formalmente designada del conjunto de datos o del recurso informativo que se describe (ags:descriptionEdition); o bien un resumen de un documento designado para dar al usuario una idea más clara del contenido del documento (dcterms:abstract).

XML content model

(ags:descriptionNotes | ags:descriptionEdition | dcterms:abstract)*

XML tag

<dc:description>
<ags:descriptionEdition>description of edition</ags:descriptionEdition>
<ags:descriptionNotes>notes</ags:descriptionNotes>
<dcterms:abstract xml:lang="eng">abstract</dcterms:abstract>
</dc:description>

XML attributes/
schemes

dcterms:abstract
xml:lang

optional

4.3.9 Elemento dc:identifier

Los identificadores ayudan a ubicar o a reconocer un recurso. A los documentos se les pueden asignar muchos números. Este elemento se reserva para los números tomados del objeto. Algunos de los números pueden anotarse en forma autorizada. Para los recursos de Internet, la URI (dirección electrónica que comienza, por ejemplo: http:// o ftp://) también se incluye en este elemento. Los números asignados por las instituciones de catalogación con fines internos no se anotan aquí, sino en el campo agls:availability.

XML content model

dc:identifier (#PCDATA)

XML tag

<dc:identifier scheme="ags:DOI">DOI id</dc:identifier>
<dc:identifier scheme="ags:IPC">International Patent Classification no.</dc:identifier>
<dc:identifier scheme="ags:ISBN">Book ISBN</dc:identifier>
<dc:identifier scheme="ags:JN">Job Number</dc:identifier>
<dc:identifier scheme="ags:PN">Patent Number</dc:identifier>
<dc:identifier scheme="ags:RN">Report Number</dc:identifier>
<dc:identifier scheme="dcterms:URI">URI of resource</dc:identifier>

XML attributes/
schemes

scheme (ags:IPC | ags:RN | ags:PN | ags:ISBN | ags:JN | dcterms:URI | ags:DOI)

opcional

4.3.10 Elemento dc:type

Si bien no es obligatorio, el valor de este elemento debe proporcionarse siempre que sea posible. Explica el tipo o género del contenido del recurso y ayuda a describir las categorías generales, funciones, géneros o niveles de agregación del contenido del recurso.

De ser posible, seleccionar los valores dc:type de la lista de tipos DCEMI[13]. Si se está utilizando un vocabulario controlado local, es necesario asegurar que no haya un código sino palabras completas para describir el género del recurso.

XML content model

dc:type (#PCDATA)

XML tag

<dc:type>DC Types controlled vocabularies</dc:type>

XML attributes/
schemes

scheme (dcterms:DCMIType)

opcional

4.3.11 Elemento dc:format

El elemento de extensión (dcterms:extent) se usa para indicar el tamaño o duración del recurso. El elemento de medio (dcterms:medium) se utiliza para indicar el material o portador físico del recurso.

XML content model

dc:format (dcterms:extent | dcterms:medium)*

XML tag

<dc:format>
<dcterms:extent>collation, size, duration of the resource</dcterms:extent>
<dcterms:medium> the material or physical carrier of the resource. </dcterms:medium>
</dc:format>

XML attributes/
schemes

-


4.3.12 Elemento dc:language

Para este elemento se recomienda anotar el código de tres letras de ISO639-2[14]. Si su sistema local no le permite utilizar el código de tres letras, anote el código de dos letras, indicando el esquema como ISO639-1[15]. Si un idioma no tiene un código en el esquema seleccionado, anótese la forma completa del idioma sin indicar el esquema.

XML content model

dc:language (#PCDATA)

XML tag

<dc:language scheme="ISO639-1">language of resource</dc:language>

XML attributes/ schemes

scheme (ISO639-1 | ISO639-2)

opcional

4.3.13 Elemento dc:relation

Este elemento se usa para ligar un recurso con otro. Permite establecer diversas relaciones entre los recursos y a los usuarios localizar recursos relacionados. Al utilizar un elemento de relación es importante establecer el tipo de relación eligiendo un valor de un lado de cualquiera de los pares siguientes de tipos de refinación de relaciones.

XML content model

(#PCDATA | dcterms:isPartOf | dcterms:hasPart | dcterms:isVersionOf | dcterms:hasVersion | dcterms:isFormatOf | dcterms:hasFormat | dcterms:references | dcterms:isReferencedBy | dcterms:isRequiredBy | dcterms:requires | dcterms:isReplacedBy | dcterms:replaces | ags:relationHasTranslation | ags:relationIsTranslationOf)*

XML tag
(only dcterms:URI scheme included for each qualifier)

<!-- physical or logical part of the referenced resource -->
<dc:relation>
<dcterms:isPartOf scheme="dcterms:URI">related URI</dcterms:isPartOf>
</dc:relation>
<!-- the referenced resource either physically or logically -->
<dc:relation>
<dcterms:hasPart scheme="dcterms:URI">related URI</dcterms:hasPart>
</dc:relation>
<!-- a version, edition, or adaptation of the referenced resource. Changes in version imply substantive changes in content rather than differences in format -->
<dc:relation>
<dcterms:isVersionOf scheme="dcterms:URI">related URI</dcterms:isVersionOf>
</dc:relation>
<!-- a version, edition, or adaptation, namely, the referenced resource -->
<dc:relation>
<dcterms:hasVersion scheme="dcterms:URI">related URI</dcterms:hasVersion>
</dc:relation>
<!-- same intellectual content of the referenced resource, but presented in another format-->
<dc:relation>
<dcterms:isFormatOf scheme="dcterms:URI">related URI</dcterms:isFormatOf>
</dc:relation>
<!-- pre-existed the referenced resource, which is essentially the same intellectual content presented in another format -->
<dc:relation>
<dcterms:hasFormat scheme="dcterms:URI">related URI</dcterms:hasFormat>
</dc:relation>
<!-- references, cites, or otherwise points to the referenced resource -->
<dc:relation>
<dcterms:references scheme="dcterms:URI">related URI</dcterms:references>
</dc:relation>
<!-- is referenced, cited, or otherwise pointed to by the referenced resource -->
<dc:relation>
<dcterms:isReferencedBy scheme="dcterms:URI">related URI</dcterms:isReferencedBy>
</dc:relation>
<!-- is required by the referenced resource, either physically or logically -->
<dc:relation>
<dcterms:isRequiredBy scheme="dcterms:URI">related URI</dcterms:isRequiredBy>
</dc:relation>
<!-- required by the referenced resource, either physically or logically -->
<dc:relation>
<dcterms:requires scheme="dcterms:URI">related URI</dcterms:requires>
</dc:relation>
<!-- is supplanted, displaced, or superseded by the referenced resource -->
<dc:relation>
<dcterms:isReplacedBy scheme="dcterms:URI">related URI</dcterms:isReplacedBy>
</dc:relation>
<!-- supplants, displaces, or supersedes the referenced resource -->
<dc:relation>
<dcterms:replaces scheme="dcterms:URI">related URI</dcterms:replaces>
</dc:relation>
<!-- has a translation, namely, the referenced resource -->
<dc:relation>
<ags:relationHasTranslation scheme="dcterms:URI">related URI</ags:relationHasTranslation>
</dc:relation>
<!-- a translation of the referenced resource -->
<dc:relation>
<ags:relationIsTranslationOf scheme="dcterms:URI">related URI</ags:relationIsTranslationOf>
</dc:relation>

XML attributes/
schemes

scheme (ags:IPC | ags:PN | ags:ISBN | ags:JN | dcterms:URI | ags:ARN)

Obligatoire

4.3.14 Elemento agls:availability

Availability (disponibilidad) proporciona al usuario un número o código asociado exclusivamente a un objeto y sirve para identificarlo en una organización. Este número suele asignarlo la organización que tiene ese objeto. Como se trata de información local, la disponibilidad debe incluir el nombre o código que identifica a la institución o acervo (ags:availabilityLocation) donde se encuentra ese objeto y el número local (ags:availabilityNumber) a través del cual se tiene acceso al recurso localmente.

XML content model

agls:availability (ags:availabilityLocation, ags:availabilityNumber)*

XML tag

<agls:availability>
<ags:availabilityLocation>availability location</ags:availabilityLocation>
<ags:availabilityNumber>availability number</ags:availabilityNumber>
</agls:availability>

XML attributes/ schemes

-


4.3.15 Elemento dc:source

Este elemento (dc:source) proporciona la referencia a un recurso del cual forma parte el recurso en uso. Al catalogar el índice analítico, este elemento se usa para dar información que permita identificar la monografía. La información de la fuente que puede contener este elemento es el título completo, los autores, etc.

XML content model

dc:source (#PCDATA)

XML tag

<dc:source>additional information of resource</dc:source>

XML attributes/
schemes

-


4.3.16 Elemento dc:coverage

Este elemento (dc:coverage) proporciona información sobre la cobertura geográfica (dc:spatiall) y temporal (dc:tempora) del recurso.

XML content model

dc:coverage (#PCDATA, dc:spatial, dc:temporal)

XML tag

<dc:coverage>additional information of resource
<dcterms:spatial scheme ="dcterms:ISO3166">coverage (ISO3166)</dcterms:spatial>
<dcterms:temporal scheme ="dcterms:TGN">coverage (TGN)</dcterms: temporal >
</dc:coverage>

XML attributes/ schemes

dcterms:spatial
scheme (dcterms:POINT | dcterms:ISO3166 | dcterms:TGN | dcterms:Box)
dcterms:temporal
scheme (dcterms:Period | dcterms: W3CDTF)

opcional

opcional

4.3.17 Elemento dc:rights

XML content model

dc:rights (#PCDATA, ags:rightsStatement, ags:rightsTermsOfUse)

XML tag

<dc:rights>
<
ags:rightsStatement>statements of rights</ags:rightsStatement>
<
ags:rightsTermsOfUse>terms of use<ags:rightsTermsOfUse>
</
dc:rights>

XML attributes/ schemes



4.3.18 Element ags:citation

Esta entrada es obligatoria cuando el recurso forma parte de una serie. Una serie es una publicación que suele tener una etiqueta numérica o cronológica, y tiene el propósito de continuar indefinidamente. Se puede presentar en cualquier medio y se publica en partes sucesivas.

XML content model

ags:citation (ags:citationTitle | ags:citationIdentifier | ags:citationNumber | ags:citationChronology)*

XML tag

<ags:citation>
<ags:citationTitle>Title of the serial</ags:citationTitle>
<ags:citationIdentifier scheme="ags:ISSN"> Identifier of the Serial </ags:citationIdentifier>
<ags:citationNumber>Number of the issue</ags:citationNumber>
<ags:citationChronology>Chronological designation of the issue</ags:citationChronology>
</ags:citation>

XML attributes/ schemes

ags:citationTitle
xml:lang
ags:citationIdentifier
scheme (ags:ISSN | ags:CODEN)

opcional

necesaria


[11] En el apéndice B figura un ejemplo de un documento del AGRIS AP en XML.
[12] Los códigos de los nombres de los idiomas figuran en: http://www.loc.gov/standards/iso639-2/langcodes.html
[13] http://dublincore.org/documents/dcmi-type-vocabulary
[14] ISO639-2: códigos de idioma en tres letras http://www.loc.gov/standards/iso639-2/langcodes.html
[15] Códigos ISO639-1 e ISO639-2 http://www.loc.gov/standards/iso639-2/codechanges.html

Página precedente Inicìo de página Página siguiente