Destacamos

« Atrás

Archivo de la Web Española

Archivo de la Web Española

Memoria digital

Una de las misiones de las bibliotecas de tipo nacional como la Biblioteca Nacional de España o la Biblioteca Valenciana Nicolau Primitiu es la de recoger, catalogar y preservar el patrimonio bibliográfico del territorio del que son cabecera.

Gracias a mecanismos como el depósito legal u obligación que tienen los editores o productores de entregar ejemplares de sus obras a las administraciones, gran parte de la producción bibliográfica editada en papel o en soportes audiovisuales se ha podido conservar para siempre en las bibliotecas de tipo nacional.

Ese procedimiento no sirve para preservar la memoria digital efímera, documentos que, pese a su alto valor informativo y testimonial sobre nuestras sociedades, se perderían para siempre al carecer de corporeidad física y para la que nos sirve el depósito legal tradicional. Es por ello que este tipo de material se recoge a través del Archivo de la Web Española.

El Archivo de la Web Española se creó inspirado en las Directrices para la preservación del patrimonio digital de la Unesco (2003) y con el respaldo normativo del Real decreto 635/2015, de 10 de julio, por el cual se regula el depósito legal de las publicaciones en línea, la Biblioteca Nacional de España comenzó a capturar páginas y sitios web españoles albergados en el dominio .es, así como en otros dominios y subdominios genéricos (.com, .edu, .gob, .org, .net, etc.).

La recolección de páginas web se realiza con robots rastreadores que recorren las URL seleccionadas previamente y guardan todo lo que encuentran enlazado, con la frecuencia, profundidad y tamaño que se determine. El resultado de estas recolecciones web son los archivos web, donde se guarda y se puede consultar lo recolectado. Para ello, se utiliza NAS (NetarchiveSuite), una herramienta de código abierto, mientras que para rastrear se hace uso del robot Heritrix, creado por Internet Archive, primera organización que empezó a rastrear y archivar la web en 1996.

La Biblioteca Valenciana Nicolau Primitiu colabora con dicho proyecto desde el año 2016, con una colección estable en la que se han recogido 1.165 recursos de distinto tipo relacionados con nuestro territorio (webs, revistas digitales, blogs, etc.), de la que se hace un seguimiento sistemático y que aumenta periódicamente. También ha participado en las recopilaciones llevadas a cabo puntualmente con motivo de eventos como las Elecciones Generales del 2019, y las Elecciones Locales y Autonómicas del mismo año.

Para cada uno de ellos, y dependiendo de la naturaleza de sus contenidos y actualización, se han fijado diferentes niveles de profundidad (toda la web, solo páginas principales, algunas secciones) o ritmo en las capturas (diario, semanal, mensual). La calidad de las capturas es también verificada por los técnicos de la Biblioteca Valenciana, que comprueban que se ha realizado de manera correcta.

COVID-19

Actualmente, la Biblioteca Valenciana colabora activamente con la BNE en la recopilación de la información generada en Internet relativa al Coronavirus en la Comunitat Valenciana. Hasta el momento se han recogido más de trescientas webs de distintos medios como periódicos, redes sociales de investigadores, webs de diversos centros de investigación, hospitales, de la propia Generalitat o de las administraciones locales con información específica sobre la pandemia. La recopilación se realiza periódicamente por lo que la colección crece de manera continua.

 

 

Para conocer más sobre el Archivado de la Web puedes consultar el siguiente enlace:

 

http://www.bne.es/es/Colecciones/ArchivoWeb/index.html