Página precedente Indice Página siguiente


3. Asuntos generales


3.1 Antes de comenzar

Se supone que los lectores de este documento ya conocen el formato XML, que aquí no se analiza. Sin embargo, se presentan al lector algunas cuestiones muy esenciales de la conversión a XML. Esta sección describe el procedimiento de conversión de los datos locales a documentos en XML compatibles con el AGRIS AP.

El AGRIS AP, o modelo de datos del AGRIS, prescribe el vocabulario, el contenido y las reglas de la estructura que se pueden utilizar para difundir información entre conjuntos heterogéneos de datos, sin necesidad de modificar el sistema local. Gracias a la posibilidad de utilizar instrumentos como el lenguaje XSLT, la extracción y conversión de información es una tarea sencilla aunque muy importante para facilitar la interoperabilidad. La posibilidad de que el recurso mismo no esté adjunto a los metadatos facilita el control de los derechos de acceso al mismo.

El AGRIS AP está acompañado de una DTD[4] que se utiliza para validar los insumos de los distintos centros de recursos. Los primeros pasos deberían ser:

3.2 Exportación desde bases de datos aptas para XML

La producción y exportación de recursos en XML desde bases locales de datos al modelo AGRIS AP (véase el Gráfico 1, abajo) se facilita cuando la base de datos de origen es apta para funcionar con documentos en XML, es decir, si admite extensiones para la transferencia de datos entre documentos en XML y sus propias estructuras de datos.

Los cuatro pasos que se enumeran a continuación describen brevemente el proceso de producción de registros validos en XML del AGRIS desde bases de datos propietarias aptas para XML:

1. Determinar los campos del catálogo de la base local de datos que coincidirán con los elementos y esquemas de la DTD en XML del AGRIS AP. El documento de mapeo obtenido enlaza los campos de la base de datos local con los elementos y calificadores de la DTD.

2. Una hoja de estilo XSLT codifica el documento de mapeo producido por los catalogadores. La plantilla enlazará y acoplará los nodos de cada campo de la base de datos local con los elementos y esquemas apropiados de la DTD en XML del AGRIS AP.

3. Los documentos bien formados en XML se convierten en recursos XML del AGRIS AP a través del procesador XSL.

4. Los documentos en XML se validan contra la DTD en XML del AGRIS AP mediante analizadores sintácticos de XML (3.2).

Gráfico 1: Procedimiento de producción del AGRIS AP XML

3.3 Ejemplo del OAI-PMH[6]

El protocolo de la iniciativa de archivos abiertos para la recuperación de metadatos (OAI-PMH) "presenta un marco de interoperabilidad independiente de las aplicaciones basado en la recuperación de datos". La ejecución del protocolo OAI permite a los proveedores de datos generar datos en XML bien formados y válidos, mediante el mapeo de sus depósitos locales a un formato común de metadatos Dublin Core (DC). La Biblioteca Universitaria de Ciencias Biológicas de Noruega[7] ha ejecutado, como proveedora de datos, el protocolo OAI, y ha expuesto sus metadatos al recopilador del AGRIS mediante un identificador único (URI). Si desea ver información detallada de la ejecución del OAI-PMH consulte las directrices de este protocolo.[8]

3.4 Transformación de XSLT a metadatos del AGRIS AP

La producción final de documentos XML del AGRIS AP se lleva a cabo con hojas de estilo XSLT. El lenguaje extensible de hojas de estilo (XSL) ofrece elementos que define las reglas para transformar un documento en XML a otro documento en XML. En este contexto, la elaboración de una XSLT puede ser fácil si la estructura del depósito local cumple las normas DC. Otros formatos más complejos de metadatos, como MARC, pueden necesitar más trabajo. Existen varias opciones que pueden considerarse, cada una con sus requisitos particulares, como diferentes campos, distintas condiciones y reglas, y diversas hojas de estilo que codificar.

El ejemplo que se proporciona a continuación se está utilizando en uno de los centros de recursos del AGRIS que utiliza un ILMS llamado InMagic. Éste muestra como se transforma una etiqueta XML de un registro extraído por InMagic (de un XML InMagic bien formado a un XML AGRIS AP válido) con una expresión XPath, mediante el nodo del Título de la base de datos local en el árbol que se produce. En lenguaje corriente las instrucciones de la XSLT dicen: si existe el elemento del título, seleccionarlo y escribirlo con la etiqueta correcta AGRIS AP XML, en este caso, el elemento de Dublin Core dc:title.

Insumo

<inm:Title---Eng-M>Conservation and use of native tropical fruit species biodiversity in Asia</inm:Title---Eng-M>

Instrucciones de XSLT

<xsl:if test="string-length(inm:Title---Eng-M)>0">
<dc:title xml:lang="eng">
<xsl:value-of select="inm:Title---Eng-M"/>
<xsl:text/>
</dc:title>
</xsl:if>

Producto

<dc:title xml:lang="eng">Conservation and use of native tropical fruit species biodiversity in Asia</dc:title>

3.5 Instrumentos para validar documentos en XML

Al validar los analizadores sintácticos verifíquese la correcta formación de los documentos XML y que los mismos documentos se conformen a las reglas específicas de la DTD en XML del AGRIS AP. El proceso de validación se puede realizar fácilmente con el analizador sintáctico Microsoft XML (MSXML) que figura en el explorador de Internet de Microsoft. En la siguiente sección se mostrará que la validación de XML en AGRIS AP se facilita porque la DTD del AGRIS está en un lugar fijo (PURL).

En Internet se pueden encontrar otros analizadores sintácticos XML, muchos de ellos gratuitos[9]. El instrumento más utilizado es XML Spy[10], un amplio conjunto utilizado para crear, editar y validar documentos en XML, XLS y esquemas de DTD/XML.


[4] La DTD en XML del AGRIS AP se puede validar en: http://purl.org/agmes/agrisap/dtd/ y se expone en el apéndice A
[5] http://www.fao.org/agris/
[6] http://www.openarchives.org/OAI/2.0/openarchivesprotocol.htm
[7] http://www.umb.no/
[8] http://www.openarchives.org/OAI/2.0/guidelines.htm
[9] http://www.xml.com/pub/rg/XML_Parsers
[10] http://www.altova.com

Página precedente Inicìo de página Página siguiente