Datos abiertos para el estudio del Mundo Antiguo




Datos Abiertos

Para investigar, necesitamos datos. Para comprobar una investigación, siempre tenemos que ir a la fuente, es decir, los datos.

En esencia, los datos abiertos (Open Data) son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona. Han de estar sujetos al requisito de atribución (CC-BY, por ejemplo), pero no a más restricciones.

Después de una breve introducción, vamos a ver algunos proyectos construidos con datos abiertos para entender mejor la Antigüedad grecorromana.

Los datos abiertos:
  • Han de ser publicados en acceso libre y abierto en internet
  • Bajo licencia abierta que exija el reconocimiento de la fuente (como CC-BY)
  • Mediante formatos legibles por máquina junto con sus metadatos

En los últimos años, los gobiernos e instituciones regionales y locales están poniendo a disposición de la ciudadanía sus datos abiertos o en abierto, desde que en 2007 se definieron los principios de la reutilización de la información en el sector público mediante datos abiertos. La reunión tuvo lugar en un lugar llamado Sebastopol, pero no en Rusia sino en California, y allí estaban Lawrence Lessig y Aaron Swartz, entre otros. Una página que recoge bastantes de los portales de datos abiertos alrededor del globo, por países, es https://www.opendatasoft.com/a-comprehensive-list-of-all-open-data-portals-around-the-world/.

Datos abiertos vinculados

Por su parte, los datos abiertos vinculados (Linked Open Data, LOD) son parte del desarrollo de la Web del Conocimiento o Web Semántica, en cuyo desarrollo las bibliotecas están llamadas a construir una parte fundamental. El diseño y estructuración de los datos abiertos vinculados está desarrollado en la W3C, de acuerdo con el diseño fundamental de Tim Berners-Lee.

Datos abiertos y la Antigüedad

Pasamos ya a ver unos cuantos proyectos de interés para los estudiosos del mundo antiguo en cualquiera de sus vertientes. Los primeros proyectos de datos abiertos fueron del ámbito geoespacial, que han dado sus frutos en algunos proyectos muy interesantes.

Pelagios Commons 

http://commons.pelagios.org/

Se trata de un proyecto que vincula los geodatos abiertos con las humanidades. La versión para estudiantes, Peripleo, es un mapa interactivo donde buscar y localizar cualquier cosa que se nos ocurra: http://peripleo.pelagios.org/ La base de datos de numismática es una de las más amplias. Vamos a poner un ejemplo de búsqueda. Podemos elegir sobre el mapa físico, el mapa político de la Antigüedad romana y el mapa visto por satélite.

captura del mapa político de la Antigüedad

Vamos a buscar, por ejemplo, qué hay de Masada, la fortaleza en el desierto de Judea, desde donde, a quien esto escribe, se le cayó una vez el sombrero:


Y si le damos abajo, donde reza 10 items link here, nos enlaza a los documentos de los que tenemos datos abiertos que estén vinculados con Masada. En este caso, las inscripciones de la Epigraphic Database Heidelberg.



Además de ello, se nos proporcionan los enlaces a cuantos portales con datos abiertos tengamos, como, en este caso, el Atlas digital del Imperio Romano (http://dare.ht.lu.se/places/22170.html) o de Pleiades (url=https://pleiades.stoa.org/places/687968).

Roman Open Data 

http://www.romanopendata.eu/

Es un proyecto del CEIPAC (Centro para el Estudio de la Interdependencia Provincial en la Antigüedad Clásica) de la Universidad de Barcelona. El CEIPAC tiene, entre sus proyectos, el de epigrafía anfórica latina y el de epigrafía anfórica griega. Los resultados pueden geolocalizarse en un mapa, que permite visibilizar asimismo una búsqueda temporal y facetada, además de devolvernos los registros en lenguaje SPARQL. Puros datos abiertos vinculados, de los auténticos, para crear una web semántica de calidad, sí señor: http://romanopendata.eu/sparql/doc/index.html

Valga como ejemplo una búsqueda tonta de algo esperable en epigrafía: COS (abreviatura de consulibus):



EAGLE (Europeana Network of Greek and Latin Epigraphy)


EAGLE la colección de Europeana de epigrafía latina y griega. Europeana, a su vez, es una colección multilingüe on-line de miles de objetos digitalizados por las instituciones de los distintos países y regiones que conforman la Unión Europea. EAGLE cuenta con un potente motor de búsqueda, basado en vocabularios controlados. Al contrario que Roman Open Data o Pelagios Commons, no localiza en primer lugar el objeto digital sobre el mapa, sino que nos da el nombre del sitio de procedencia, desde donde a veces se enlaza a Trismegistos, si procede.

Trismegistos https://www.trismegistos.org/ es una base de datos de metadatos sobre recursos epigráficos y papirológicos de la Antigüedad grecolatina, al principio solo de Egipto, aunque últimamente pretende cubrir todo el Mundo Antiguo. No está construido con datos abiertos enlazados, pero enlaza con otros proyectos que sí lo están, como EAGLE.

Getty Vocabularies

http://vocab.getty.edu/
http://www.getty.edu/research/tools/vocabularies/index.html

Se trata de tesauros que recogen la forma canónica de los términos en varios campos, así como mucha información relacionada. Son registros de autoridades, en distintas lenguas, al modo del fichero de autoridades virtual internacional (VIAFhttps://viaf.org/, aunque centrados en campos muy concretos y que, por añadidura, nos traen la representación semántica de los lemas (JSON, JSONLD, RDF, N3/Turtle, N-Triples).

Como muestra, un botón: el registro de VIAF y el de Getty (ULAN) sobre Miguel de Cervantes.

Y otro, ya que estábamos con Masada. VIAF, creado específicamente para bibliotecas e instituciones de memoria, nos ofrece los registros en formato MARC 21 (XML), Json, XML y RDF (http://viaf.org/viaf/103144648436932129850). El registro de Getty ofrece otros datos (http://vocab.getty.edu/page/tgn/7001381). Ambos instrumentos son perfectamente compatibles, no excluyentes.

Otros proyectos de datos abiertos

No podemos citarlos todos, pero baste por ahora por nombrar el algo antiguo MAPPA, http://www.mappaproject.org/, de la Universidad de Pisa, sobre predictibilidad arqueológica, o el muy reciente LatinNOW, https://latinnow.eu/, sobre la latinización de las provincias noroccidentales.

Créditos foto de portada: Late ancient mosaic with Greek inscriptions, near the former synagogue. Archaeological site at Kolona, Aegina, por Zde, CC-BY 3.0, vía Wikimedia Commons.