Tecnologías: Libre Acceso al conocimiento (4/4)
(Última actualización: 27/09/2018)
No obstante, Open Access y Open Archives Initiative son conceptos distintos: mientras que Open Access se refiere, como hemos visto, a la política de acceso abierto de las publicaciones científicas, la Open Archives Initiative proporciona la tecnología necesaria para hacer visibles y accesibles los documentos de acceso abierto.
Open Archives Initiative
Logo Open Archives Initiative, CC BY-SA 4.0 |
Un protocolo de comunicaciones es un conjunto de reglas o normas de obligado cumplimiento por parte de todos los agentes, máquinas o programas que intervienen en una comunicación entre sistemas. FTP (Protocolo de Transferencia de Ficheros) y HTTP (Protocolo de Transferencia de Hipertexto) son ejemplos de otros protocolos utilizados para la comunicación entre sistemas a través de Internet.
Nick Youngson CC BY-SA 3.0 |
Era necesaria, pues, la unificación de todos los protocolos e interfaces.
En la Convención de Santa Fe (1999), se propuso la creación de un servicio universal para el autoarchivo por parte de los autores de documentos académicos (Universal Preprint Service, o UPS, como el famoso servicio de paquetería). El UPS sería «una capa básica y libre para la información académica, por encima de la que podrían prosperar tanto servicios gratuitos como servicios comerciales». Pretende, por tanto, ofrecer tecnologías y marcos de interoperabilidad para la difusión de e-prints. Esto daría paso al OAI-MHP, que universaliza el acceso a la información.
OAI-MHP
El UPS pronto cambió de nombre y pasó a llamarse OAI-MHP, Open Archives Initiative-Metadata Harvesting Protocol (protocolo de recolección de metadatos).Metadatos son datos sobre datos o, más exactamente, los datos que describen el contenido informativo de un objeto.
Aunque inicialmente se creó para ser aplicado a depósitos de documentos en acceso abierto, muy pronto se vio que podía implementarse sobre cualquier sistema que requiriese la comunicación de metadatos. Desde 2002 está operativa la versión 2.0, orientada a tal fin. La arquitectura del OAI-MHP v. 2.0 deja de ser pensada para el usuario humano y ahora se destina tanto al humano como a la máquina.
El Protocolo UPS y después el OAI-MHP contemplan dos funciones lógicas: Proveedores de Datos y Proveedores de Servicios.
Un Proveedor de Datos mantiene uno o varios repositorios que soportan OAI-PMH como medio de exponer sus metadatos.
Un Proveedor de Servicios envía peticiones OAI-PMH a los proveedores de datos y utiliza los metadatos como base para la creación de servicios de valor añadido. De esta forma un Proveedor de Servicios "recolecta" los metadatos expuestos por los Proveedores de Datos. Esos valores añadidos pueden ser: sistema de búsqueda e identificación, filtrado, alertas temáticas, medición del uso e impacto de los documentos, etc.
OAI-PMH_basic, por Neil Fegen Copyright holder: Heriot-Watt University Adaptado de: http://www.oaforum.org/tutorial/english/page3.htm CC-BY SA 3.0 |
Es decir, aunque OAI-PMH no es un protocolo de búsqueda, su utilización puede servir de apoyo para los servicios de búsqueda. Es una capa básica sobre la que construir otros servicios.
El principal requisito para una interoperatividad básica es el formato Dublin Core, http://dublincore.org/. Se basa en un conjunto de quince elementos, repetibles y no obligatorios (título, autor, materia, fecha, etc.), descriptibles por medio de propiedades, vocabularios controlados y esquemas de codificación, Carece de sintaxis propia, por lo que se puede codificar mediante XML. Quizá nos extendamos sobre esto en otra entrada.
Aunque el Dublin Core se establece como requisito, OAI-PMH se puede extender a cualquier formato de metadatos que puedan ser codificados en XML. Se basa en HTTP para las peticiones y en XML para las respuestas, está adaptado a la web y pensado para ella.
Otros proyectos OAI
Banco de peces, como metáfora de la agregación de elementos. CC BY-NC ND Fotografía de Linda Castañe |
Una agregación puede componerse, por ejemplo, por las diferentes versiones de un artículo o por los diferentes artículos de una revista, procedentes de distintos repositorios. OAI-ORE introduce el concepto de mapa de recursos (Resource Map o ReM), que permite establecer agregaciones de recursos y entender su estructura.
ResourceSync Framework Specification (ANSI/NISO Z39.99-2017). ResourceSync describe un marco de sincronización para la web que permite que los sistemas de terceros permanezcan sincronizados con los recursos en evolución de un servidor. La especificación reutiliza los formatos de documentos definidos por el protocolo Sitemap.
Software para repositorios
El software para la creación de repositorios es, como no podía ser menos, software libre y de código abierto, aunque bajo distintas licencias. Todos ellos cumplen con el Protocolo OAI-MHP. Además de los que aquí citamos, hay otros que pueden verse en la página de la OAI: https://www.openarchives.org/pmh/tools/- Eprints. Surgido directamente de la citada convención de Santa Fe, es el software más utilizado hasta la fecha. EPrints fue desarrollado en la Facultad de Electrónica e Informática de la Universidad de Southampton y publicado bajo licencia GPL en el año 2000. Actualmente va por la versión 3.4. Está escrito en el lenguaje de programación Perl. Repositorio: https://github.com/eprints/eprints
- Invenio (antes CDSware, luego CDS Invenio, ahora solo Invenio). Ha sido desarrollado por el CERN (European Organization for Nuclear Research) y es el que utiliza este centro de investigación para su propio servidor de documentos. Está escrito en Python y publicado bajo licencia GPL. Repositorio: https://github.com/inveniosoftware/invenio
- DSpace. Desarrollado por el MIT, en colaboración con Hewlett Packard, está publicado esta vez bajo licencia BSD. La licencia BSD al contrario que la GPL permite el uso del código fuente en software propietario. Está escrito en Java.
- Fedora Commons. Esta basado en Flexible Extensible Digital Object and Repository Architecture (Fedora). El sistema esta diseñado de forma que sobre el se construyan repositorios y otras bibliotecas digitales que cumplen con el protocolo OAI-PMH. Lo han desarrollado la Universidad de Virginia y la Universidad de Cornell. Está escrito en Java y publicado bajo licencia Apache 2.0
Para saber más...
- Open Archives Forum: https://www.oaforum.org/index.php
- La iniciativa de ficheros abiertos (Open Archive Initiative – OAI): protocolo OAI-PMH, proveedores de datos, proveedores de servicios, en: SEDIC, Acceso abierto y repositorios de documentos. Accesible en: http://www.sedic.es/autoformacion/acceso_abierto/4-iniciativa-ficheros-abiertos.html Consultado el 18/05/2018.
- OAI para principiantes, tutorial en línea del Open Archives. Forum. Traducción española de: Domingo Arroyo. Ministerio de Cultura, Dirección General de Libro Archivos y Bibliotecas. Disponible en: http://travesia.mcu.es/portalnb/jspui/html/10421/1823/page1.htm Consultado el 19/05/2018.
- Introducción a los metadatos: estándares y aplicación. http://www.sedic.es/autoformacion/metadatos/tema1.htm Consultado el 19/05/2018.
- López, José María. Metadatos: qué son y cómo leerlos. Hipertextual. https://hipertextual.com/2018/01/metadatos-que-son-leer-editar Consultado el 15/05/2018.
- Orduña-Malea, Enrique. “Reutilización e intercambio de objetos digitales compuestos en la Web: el proyecto OAI-ORE“. Anuario ThinkEPI, 2009, v. 3, pp. 45-48. http://eprints.rclis.org/16614/ Consultado el 19/05/2018.
Créditos foto de portada: Circuits, Dancing Lemur vía Flickr, CC-BY NC 2.0