Big Data en Humanidades Digitales


Con Big Data, macrodatos, datos masivos o inteligencia de datos no nos referimos solo a un montón de datos que ocupan un montón de exabytes, sino, especialmente, a la forma en que se relacionan entre ellos, de forma interconectada. El vasto volumen de los datos presupone que han de ser recolectados, transformados, procesados, analizados y visualizados mediante medios informáticos.

El gran volumen y la naturaleza de red interconectada (network) de esos datos hacen difícil, si no imposible, el procesamiento tradicional, más o menos manual, aunque ya informatizado. Por ello, el término Big Data hace referencia también a la forma de analizar y procesar esa información, mediante la minería de datos, por ejemplo, que consiste, en esencia, en extraer patrones de grandes conjuntos de datos.

Y...¿esto que tiene que ver con las humanidades, especialmente con las clásicas? Algo tendrá que ver, ya que los proyectos de Big Data se están empezando a desarrollar también en humanidades en importantes universidades y, en Cambridge, también en clásicas. No obstante, estos proyectos están aún en una fase preliminar, embrionaria.

Una de las características de la importancia del estudio mediante datos masivos es la interdisciplinariedad. Los datos pueden y deben estudiarse mediante distintos puntos de vista y de forma interconectada. Y en esto, los estudiosos en el campo de las humanidades tenemos cierta costumbre. Además, los clasicistas (y los filólogos y lingüistas en general) estamos acostumbrados a trabajar con métodos cuantitativos y puros datos: corpus más o menos grandes de textos, bases de datos y colecciones, concordancias, que se han digitalizado en proyectos como Perseus, DDBDP, Ancient Graffiti y otras bases de datos.

Excavaciones de Acrotiri, en Tera (Santorini), cortesía de Norbert Nagel vía Wikimedia Commons, CC-BY-SA 3.0

En clásicas, los proyectos más conocidos son Pleiades y Pelagios, del que ya hablamos en otra entrada. Hay otros GIS históricos que nos pueden interesar (o que a mí me interesan), como el mapa de las juderías bizantinas, de la Universidad de Cambridge, entre otros. En ellos, los corpus de textos se interconectan con los Sistemas de Información Geográfica (SIG o GIS, por sus siglas en inglés) que conectan la ubicación espacio-temporal de un sitio concreto, sea yacimiento arqueológico, barrio antiguo de una ciudad, etc., con toda la información disponible sobre todos y cada uno de los elementos que los constituyen o que con ellos se relacionan (imágenes y vídeos, documentos textuales, referencias bibliográficas, enlaces a informaciones exteriores de instituciones de memoria, tales como museos y bibliotecas, etc.). La imparable digitalización de los fondos de estas instituciones, así como de la documentación asociada, provee, además, un importante volumen de datos imposible de procesar con métodos tradicionales.

Para saber más...

Frédéric Kaplan (2015), A map for big data research in digital humanities, Frontiers in Digital Humanities  2; URL=https://www.frontiersin.org/article/10.3389/fdigh.2015.00001; DOI=10.3389/fdigh.2015.00001    ISSN=2297-2668 

Elizabeth Wueste (2017), Big Data, Big Problems, Eidolon Dec 18, 2017, https://eidolon.pub/big-data-big-problems-e09a55bf2b31

Schiuma, G., & Carlucci, D. (2018).Big data in the arts and humanities. Theory and practice London: CRC Press (U.K.).