Los secretos de los palimpsestos revelados por IA: descubre los avances recientes en la restauración digital de manuscritos medievales

Las inteligencias artificiales tienen de polémico lo mismo que de fascinante. En el terreno de la historia, la lingüística y la arqueología, al menos, la IA parece estar demostrando su utilidad con solvencia. Una de las aplicaciones concretas de estas nuevas tecnologías concierne a los palimpsestos. Estos manuscritos, caracterizados por contener capas superpuestas de escritura borrada y sobrescrita a lo largo de los siglos, se han considerado un desafío casi insalvable para la filología y la historia. Puesto que las tintas se difuminan en el soporte, interactúan con las fibras del pergamino y se mezclan con inscripciones posteriores, la recuperación de los textos originales resulta ardua en extremo. Ahora, un nuevo estudio de José L. Salmeron (CUNEF University) y Eva Fernández-Palop (Universidad de Zaragoza), publicado en Mathematics en 2025, propone una nueva metodología: el uso de inteligencia artificial adversarial para reconstruir de manera no invasiva los textos de los palimpsestos.

Palimpsestos: un reto histórico y tecnológico

Los palimpsestos suponen un reto para los investigadores. Estos soportes reutilizados se convierten en testigos materiales de la transmisión del saber, donde las capas de escritura se superponen en una misma superficie. El borrado, tanto químico como mecánico, de las capas previas de escritura, necesario para poder usar de nuevo el soporte, es un proceso que deja huellas microscópicas sobre el papiro y el pergamino. Estas huellas son esenciales para poder descifrar los textos perdidos. Hasta ahora, se recurría a la imagen multiespectral o a complejas técnicas ópticas para descifrar los palimpsestos. Aunque útiles, estas técnicas presentaban limitaciones notables en cuanto a resolución y accesibilidad.

Recreación fantasiosa. Fuente: Midourney/Erica Couto

El salto de la IA

El estudio de Salmeron y Fernández-Palop propone un marco basado en redes generativas adversariales (GAN) combinadas con arquitecturas U-Net, capaces de producir reconstrucciones mucho más nítidas y coherentes que los métodos previos. La clave reside en el uso de datos sintéticos generados con modelos físicos, capaces de emular procesos reales como la difusión de la tinta, la interacción con las fibras del pergamino y los efectos de la superposición espectral.

Este enfoque elimina la necesidad de disponer de ingentes bases de datos reales, que, en el caso de los palimpsestos, resultan extremadamente escasas. Así, la combinación de plausibilidad física y potencia estadística de la IA ha permitido entrenar modelos robustos sin dañar los valiosos manuscritos.

Codex Ephraemi
Codex Ephraemi en la Biblioteca Nacional de París. Fuente: Wikimedia

Resultados cuantitativos: la ventaja del GAN

Los autores del estudio compararon tres modelos para comprobar cuál se adaptaba mejor al proyecto de reconstrucción de palimpsestos. Recurrieron a un autoencoder variacional (VAE) básico, una versión mejorada con mecanismos de atención y un modelo adversarial. Los resultados, según los investigadores, fueron contundentes: el GAN obtuvo un error cuadrático medio (MSE) de 0.011, frente a 0.017 del VAE básico y 0.0139 del mejorado. El modelo GAN presentaba, además, una sensibilidad sobresaliente a los caracteres difuminados y una mayor precisión para evitar falsos positivos.

El rendimiento sobre escrituras complejas como el siríaco y las minúsculas góticas sorprendió a los investigadores, donde el modelo preservó con éxito elementos como los diacríticos. La IA, además, no solo ha logrado recuperar los trazos invisibles, sino también mantener patrones de degradación plausibles, validados por comparaciones con micro-CT en palimpsestos reales.

Innovaciones técnicas: de la teoría a la práctica

El éxito del sistema radica en varias innovaciones. Por un lado, el uso de conexiones asimétricas de salto en la U-Net permitió retener información multiescala y preservar la textura fina de los caracteres. Además, la normalización por instancia aportó robustez frente a variaciones de estilo y contraste entre diferentes escrituras. El discriminador PatchGAN, además, al evaluar regiones locales de 70×70 píxeles, impuso un realismo textual que evita reconstrucciones borrosas o artificiales. Por otro lado, la generación sintética de datos a partir de principios físicos permitió entrenar modelos sin depender de complejas configuraciones experimentales.

Página del palimpsesto de Arquímedes
Página del palimpsesto de Arquímedes. Fuente: The Walters Museum/Wikimedia

Limitaciones y retos futuros

Pese al avance que supone, el método no está exento de limitaciones. Los textos extremadamente desvaídos, con contrastes inferiores al 5%, aún suponen un desafío, ya que el modelo no logra diferenciar los trazos de ruido del pergamino. Asimismo, la efectividad del proceso depende de equilibrar cuidadosamente la representación de diferentes sistemas de escritura durante el entrenamiento, para evitar sesgos interpretativos que apunten hacia los alfabetos más frecuentes.

Los autores proponen tres direcciones para el futuro. Se plantean adaptar el sistema a dominios específicos mediante un aprendizaje parcialmente supervisado, modelar el deterioro en el tiempo mediante ecuaciones diferenciales neuronales y ampliar la generalización a reconstrucciones hiperespectrales de más de 300 canales. Estos pasos consolidarían la transición entre la innovación computacional y la práctica filológica.

Recreación fantasiosa. Fuente: Midourney/Erica Couto

Implicaciones para la historia y la filología

La posibilidad de acceder a textos perdidos sin intervenir físicamente en los manuscritos abre un horizonte nuevo para los estudios históricos. Textos borrados o dañados en el pasado podrían recuperarse con una fidelidad nunca vista hasta el punto de revelar tradiciones filosóficas, teológicas y científicas ocultas durante siglos. Además, al no depender de instrumentación costosa, esta tecnología democratizaría el acceso a la investigación, permitiendo que instituciones más pequeñas preserven y estudien su patrimonio documental.

El trabajo de Salmeron y Fernández-Palop marca un antes y un después en el estudio de los palimpsestos. La IA adversarial, nutrida de modelos físicos y entrenada con datos sintéticos, ha demostrado superar los métodos anteriores en precisión y fiabilidad. Aunque aún existen retos por resolver, los resultados indican que estamos entrando en una nueva era: la de la recuperación digital no invasiva de textos que parecían perdidos para siempre.

Referencias

  • Salmeron, Jose L. y Eva Fernandez-Palop. 2025. “Physically Informed Synthetic Data Generation and U-Net Generative Adversarial Network for Palimpsest Reconstruction”. Mathematics, 13.14: 2304. DOI: https://doi.org/10.3390/math13142304

Cortesía de Muy Interesante



Dejanos un comentario: