La tecnología está revolucionando la filología. Yo he hecho lo que he podido, fortuna lo que ha querido es la comedia que se conservaba en la Biblioteca Nacional de España, impresa en Sevilla entre 1632-1634 y que estaba atribuida a un tal Miguel Bermúdez. Sin embargo, gracias al Proyecto ETSO (Estilometría aplicada al Teatro del Siglo de Oro) acaba de atribuírsele la autoría de Lope de Vega. Se conoce como Humanidades Digitales a la disciplina que trata de dar respuesta desde la tecnología a los problemas clásicos que presentan las disciplinas humanísticas. La digitalización de catálogos, los programas que hacen búsquedas semánticas o relaciones de palabras, las fotografías con las que se pueden ver los borrones y tachones o el análisis químico de las tintas abren un nuevo y amplio camino para reescribir (o hacer apuntes y aportaciones) la historia de la literatura y del patrimonio cultural.

El catedrático de la Universidad de Valladolid Germán Vega lleva más de cuarenta y cuatro años estudiando a Lope de Vega, así como el contexto social y cultural de la época. Cuenta que hace cuatrocientos años la sociedad española estaba enganchada a los corrales de comedias y era “como una pasión colectiva, el teatro era la actividad principal para atender el ocio. Había una hiperproducción de obras porque había un sobreconsumo. Era el gran divertimento desde finales del siglo XVI, a lo largo del XVII y XVIII”.

El teatro se convirtió en el género literario más leído. Es por eso que los grandes autores como Calderón, Tirso o Lope de Vega producían como churros: “Tenemos 500 obras atribuidas a Lope, Shakespeare tiene unas 30. En el Arte nuevo de hacer comedias, que Lope publica en 1609, explica las claves para el éxito: subir a escena el tema del amor y del honor; incluir los arquetipos de galán y dama, o el del gracioso, el encargado de hacer las bromas que casi siempre es el criado del galán; y el desenlace final más aplaudido, el concierto del matrimonio”. German Vega asegura que Lope de Vega es “inigualable manejando la acción y la trama, y buenísimo con la poesía, porque hay que recordar que el teatro era en verso”.

Cada autor tiene un estilo, unas palabras que maneja más que otras, unos ritmos e intensidades, unos temas o sentimientos con los que juegan sus personajes de forma característica. Cabe señalar que las obras en el Siglo de Oro no tenían copyright (por tanto tampoco royalties) y estaban sometidas a un mercadeo constante. El autor vendía la obra al director de la compañía que la iba a representar (ese era el único momento de cobro), y en ocasiones se decía de quién era, pero otras no. También podía acabar firmándola un copista o alguien de la compañía.

Hasta ahora la cronología de las obras (porque la mayoría no están fechadas), así como la autoría y los detalles de la intrahistoria, se investigaban manualmente estudiando la métrica de las estrofas, mirando la intertextualidad y las expresiones en otras obras del supuesto autor, por ejemplo. “Muchos impresos teatrales no tienen colofón, con lo cual no se conoce la imprenta, así que a base de estudiar la tipografía de todas ellas puedes saber de qué taller salió. Es un trabajo minucioso y laborioso”. Vega asegura que cuando vio la suelta de Yo he hecho lo que he podido, fortuna lo que ha querido y la comparó con otras supo que era del taller de Francisco de Lira en Sevilla y pudo fecharla. “También yo di con la copia de la Biblioteca Nacional, ya que tengo centenares de obras catalogadas en mis ficheros de papel a mano”, afirma el catedrático.

Jose Luis Bueren es director técnico de la Biblioteca Nacional de España: “Nos queda mucho por hacer pero ya tenemos más de doscientas mil obras digitalizadas del fondo y subidas a la web Biblioteca Digital Hispánica. Los investigadores de Humanidades destacan que la no necesidad de acudir a la Biblioteca les ha facilitado el trabajo, un ahorro de tiempo y esfuerzo considerable”.

Bueren asegura que, al estar disponibles estos textos en formato digital, se ha facilitado la creación de programas de procesamiento de lenguaje natural o de fotografías que permiten ver tachaduras en manuscritos, así como de ediciones digitales críticas en las que se pueden ver, a la par que el texto original, las aportaciones de los investigadores. German Vega cuenta que, ahora que los textos están digitalizados, encontrar expresiones paralelas simplemente es ir a los buscadores contextuales, lo que hace años tardaba meses en hacerse. También hay programas que miden la estadística del uso del léxico con los que se puede hacer medias por autores y compararlas, cuentas que para una persona es imposible de hacer.

Álvaro Cuéllar fue alumno de German Vega, y ahora es filólogo doctorando en la University of Kentucky y receptor de una beca La Caixa. Profesor y exalumno han desarrollado el proyecto ETSO (de Estilometría aplicada al Teatro del Siglo de Oro), que revoluciona las atribuciones y autorías de obras teatrales. La estilometría se utilizó, por ejemplo, para descubrir la identidad de un libro que escribió J.K.Rowling, autora de Harry Potter, que cansada del asedio publicó El canto del cuco bajo seudónimo, y los investigadores rápidamente dieron con que era ella aplicando técnicas informáticas.

Nos cuenta Cuéllar: “Gracias a Transkribus, una herramienta de la Universidad de Innsbruck, he podido desarrollar un proceso que nos permite transcribir de forma automática tanto impresos como manuscritos antiguos. La máquina empareja el texto que tú trascribes con la imagen de la letra, al final aprende a hacerlo sola. Esto nos ha permitido digitalizar documentos muy antiguos, con letras que no son modernas, y por las que no funciona el OCR (Reconocimiento Óptico de Caracteres)”. Álvaro Cuéllar y German Vega han trabajado durante años y coordinado más de 100 colaboradores para recolectar obras con el objetivo de que el proyecto ETSO contara con el mayor número posible de textos. A día de hoy han reunido más de 2700 de 350 autores distintos, unos 35 millones de palabras, con el que hacer comparaciones y pruebas estadísticas.

Su método es aplicar la estilometría para encontrar cuáles son las obras con estilo más cercano a la obra que se estudia. Cuéllar asegura que al escribir empleamos las palabras en una frecuencia distinta de forma inconsciente, que cada autor las emplea en proporciones distintas. “La estilometría es capaz de comparar el uso de la frecuencia de las palabras y asignar una distancia numérica entre el estilo de un autor y de otro. Es con estas distancias con las que nosotros podemos inferir las relaciones autoriales”.

ETSO mide cómo cada autor emplea las 500 palabras más frecuentes y gracias a esto establece relaciones: “somos capaces de calcular la distancia numérica que separa la frecuencia de uso de las palabras, lo que podemos llamar el estilo, entre un autor y otro, y como pasó en Yo he hecho lo que he podido, fortuna lo que ha querido podemos inferir que esta obra es de Lope. Pero podemos investigar otra y que se acerque a Calderón, o a Tirso de Molina o a Ruíz Alarcón. Cada nueva obra que analizamos puede darnos la sorpresa y conducirnos a una atribución inesperada”.

Sònia Boadas es profesora de la Universidad Autónoma de Barcelona y miembro del grupo de investigación Prolope. Es especialista en manuscrito autógrafo de Lope de Vega (aquellos que han salido de su pluma) de los que asegura que se conservan unas 45 comedias repartidas en bibliotecas más allá del territorio español. “El ojo humano es capaz de ver un determinado espectro de la luz, la fotografía espectral permite ver más allá, como es el infrarrojo o el ultravioleta. Esta técnica me ha permitido ver tachaduras y modificaciones que hacía Lope”, cuenta Boadas, que se conoce su caligrafía “al dedillo”.

Además de la grafía, se pueden ver las modificaciones que hacía el director de la compañía, e incluso, por encima, la letra y tachones del censor. “Así que podemos investigar de qué mano salieron las modificaciones. Cuando las tachaduras son de una tinta que no es la del propio autor es más fácil sacar conclusiones. Otro técnica que he empleado es la de fluorescencia de Rayos X, con la que se analiza la composición química de la tinta, así podemos deducir cuántas tintas y manos y cambios han pasado por los textos” afirma Boadas, que agradece la colaboración interdisciplinar para seguir la pista y la historia de los manuscritos autógrafos.

Cuéllar concluye: “Las Humanidades Digitales nos permiten leer la literatura como jamás lo habíamos hecho, analizando a la vez cientos o miles de textos, comparando autores, géneros o siglos, y llegando a conclusiones que se le escapan al limitado cerebro humano. En los próximos meses daremos cuenta de decenas de hallazgos autoriales que pueden hacer que nos replanteemos los que creíamos conocer sobre el Siglo de Oro”.