domingo, 20 de enero de 2008
Biblioteca Digital Hispánica
viernes, 14 de diciembre de 2007
Acceso libre al fondo antiguo de la UB
Leo en "La vanguardia" que a través de Cervantes Virtual, se puede acceder libremente al fondo antiguo que la UB (Universidad de Barcelona) guarda en su biblioteca. Dicho fondo se compone de unos 2.169 manuscritos (el más antiguo del siglo X), 948 incunables, 150.000 impresos, 8.060 grabados y 890 pergaminos de diversa procedencia. Excepto el fondo manuscrito, todo os demás se puede localizar a mediante la consulta del catàlogo de fondo moderno y de fondo antiguo (hasta 1820).
lunes, 3 de diciembre de 2007
Formatos de documentos digitales

Cada formato posee una funcionalidad y unas características específicas que dependerán del objetivo buscado.
Formatos de imagen
Los formatos de imagen se utilizan para mostrar imágenes digitales de las páginas del texto, fotografías, ilustraciones, y cualquier otro tipo de material gráfico. Cuando hablamos de digitalización, normalmente nos estamos refiriendo a imágenes digitales de las páginas de papel. Los formatos más comunes son TIFF, GIF, y JPEG.
La información en imágenes es una copia exacta del original y no puede ser indizada (salvo tratamiento con un OCR). Son archivos no editables y por tanto, el texto no puede ser modificado fácilmente. Son muy utilizados para el intercambio y archivo ya que son soportados por cualquier software de tratamiento de imagen.
Los archivos TIFF son archivos de gran tamaño, y por ello, no son usados generalmente en Internet. Frente a ellos, los archivos JPEG permiten alcanzar un alto nivel de compresión (aunque cuanto más alta es la compresión, más baja es la calidad de la imagen), y por ello, es un formato muy extendido en Internet.
Formatos de texto
Los formatos de texto son la forma más simple de documento electrónico. Estos documentos contienen solamente una cadena de caracteres y carecen de otros elementos más sofisticados como diagramas, tablas, cuadros binarios, sonido, etc. Los estándares de codificación más comunes para el texto son ASCII, UNICODE y RTF. Éste último es compatible con todos los procesadores de texto desarrollados por Microsoft y a diferencia de los otros dos, preserva características del formato del documento original como negritas, cursivas, subrayados, notas al pie, etc.
Los formatos de texto (a diferencia del formato de imagen), sí permiten un tratamiento más fácil
Formatos de la presentación
Son formatos que se han desarrollado para presentación o impresión en pantalla. Son formatos estáticos y no contienen ninguna información de la estructura. Los formatos más comunes son PostScript y PDF.
PDF es un formato de almacenamiento de documentos relativamente nuevo y basado en PostScript. Fue desarrollado por Adobe Systems y está especialmente ideado para documentos susceptibles de ser impresos ya que especifica toda la información necesaria para su presentación final sin requerir procesos anteriores de ajuste o maquetación. Cada vez es más utilizado gracias a la gran calidad de las fuentes utilizadas y a las facilidades que ofrece para el manejo del documento, (búsquedas, hiperenlaces, ...). Adobe facilita el programa para leer este tipo de documentos.
Formatos estructurados
Son formatos que se apoyan en la utilización de marcas o etiqueta explícitas. Los formatos que encontramos en esta categoría son SGML, XML, y HTML. XML (subconjunto simplificado de SGML) se ha convertido en poco tiempo en el estándar del Sitio Web. La utilización de un formato de codificación simple y universal como XML permite perpetuar los documentos electrónicos. XML es el formato ideal ya que además de ser un formato no propietario, y por tanto ofrecer garantía de preservación de la información (ASCII), permite estructurar la información y el intercambio de información a todos los medios.
¿Perservación de los documentos o... negocio?

El proyecto de Google empezó cuando puso a disposición de los usuarios los primeros 10.000 libros indexados, todos ellos pertenecientes al dominio público. Dejó claro que su intención era digitalizar incluso las obras sujetas al régimen de copyright negociando con los editores las condiciones de explotación. El usuario puede ver la referencia bibliográfica, la portada, el índice, un máximo de tres páginas y las referencias de copyright. Cada libro sería digitalizado íntegramente, aunque no significa que pueda leerse o descargarse en su totalidad. En Estados Unidos, tanto los grandes grupos editoriales como la organización que representa a los autores rechazan la idea, mientras no se clarifiquen las condiciones económicas.
Google consideró oportuno volcarse sobre Europa. Continuó las negociaciones con editores de otros países, en España con los grupos Anaya y Planeta. Posteriormente Amazon puso a punto su nuevo servicio Amazon Pages, que desde comienzos de 2006 inició experimentos con distintos modelos de negocio.
En un primer momento se propuso la remuneración a los editores con un porcentaje sobre los ingresos publicitarios que generasen los anuncios en las páginas relacionadas con sus libros, aunque no parecía prosperar. Posteriormente se propuso que libros fuera de catálogo que no merecieran ser reeditados, se pudieran digitalizar. Tanto Google como Amazon, adquirieron empresas especializadas en la impresión bajo demanda. Cuando un título no estuviese disponible, el usuario podría optar entre descargar una copia a su ordenador o encargar la impresión de un ejemplar; y en ambos casos, tendría que pagar aunque un precio muy bajo. Por uno u otro camino, Internet podría convertirse en un instrumento de revitalización del mercado del libro. Resulta paradójico, ¿no?
Hoy en día Google sigue firmando acuerdos con el fin de seguir digitalizando los fondos de distintas instituciones y universidades, como recientemente ha hecho con la Universidad Nacional Autónoma de México.
domingo, 2 de diciembre de 2007
Alguna pega tambien...
Desde el punto de vista de la equipación, tuve oportunidad de ver, que una estupendísima cámara planetaria, utilizada en una (también estupendísima) biblioteca histórica, se encontraba arrinconada a pesar de estar en perfecto estado operativo. El motivo, el sistema operativo. Cuando se compro la cámara el sistema operativo para el que estaban hechos los drivers, era un windows 3.x. En el espacio de 10 años el sistema operativo había cambiado de versión varias veces, la evolución del hardware había progresado casi geométricamente, de manera que la tecnología de conexión de la cámara al ordenador había quedado totalmente obsoleta. Prescindiendo totalmente del hecho de si la inversión se había o no amortizado desde el punto de vista económico, nos encontrábamos ante el hecho de que había sido necesario volver a invertir en otros escaneres de trayectoria para poder seguir trabajando en los nuevos ordenadores. No hubo elección ya que tampoco es posible encontrar en el mercado ordenadores antiguos.
Ahora dos ideas: que hubiera pasado si el sistema operativo hubiera sido linux, que hubiera permitido adaptar los drivers de la cámara tanto a las nuevas versiones del sistema operativo como al nuevo hardware de los ordenadores. ¿Es bueno subyugarse a un sistema operativo propietario, que nos obligue a ir por los caminos que su fabricante nos marque independientemente de que no tenga nada que ver con nuestro trabajo?
La otra idea es sobre el hecho de que además del sistema operativo y los drivers de dispositivos conectados a los ordenadores, también existen una serie de formatos de imagen también en continua evolución. Si nosotros ahora estamos digitalizando los libros en un formato de terminado, que pasara con esos formatos dentro de 50 años. Se seguirá manteniendo in-eternum una compatibilidad hacia atrás con ellos? De que manera se conservaran tanto software como hardware que nos asegure dentro de 50 años poder acceder y consultar la información almacenada en esos formatos? Pensemos en ello. No es algo trivial. El desarrollo tecnológico no solo debe mirar hacia delante, también debe pensar en no dejar nada por el camino que luego echemos de menos. En esto pensaron ya las personas de OpenRaw...
José María Carrillo
Fondo antiguo y digitalización: Acceso y Preservación.
Ahora intentaremos lo mismo pero en base a aspectos mas especializados, en general aspectos relacionados con los distintos campos de investigación que tengan relación con el fondo antiguo.
Sin complicarnos demasiado la vida se nos ocurren a priori: diplomática, historia, literatura, arte, tipografía, edición, encuadernación, imprenta…, y así podríamos seguir, pero nos vamos a detener.
Pensar en alguien que tenga interés en hacer un estudio sobre cualquiera de estos campos sobre fondos antiguos. Intentemos cuantificar el esfuerzo que supondría (en términos generales) alguna de estas investigaciones: el investigador o estudioso necesitaría localizar los ejemplares objeto de su estudio, contactar con quien los tuviera en propiedad, solicitar permisos de acceso, concertar en algunos casos la visita o incluso la reserva, desplazarse a los lugares donde se encontraran los ejemplares,….
Ahora analicemos esta misma situación desde el punto de vista de la biblioteca digital: en el peor de los casos tendría que registrarse en la pagina web de la biblioteca que exhibiera el ejemplar objeto del estudio. Por regla general, las digitalizaciones ofrecen distintos niveles de calidad, que serán útiles a distintos tipos de estudio (pensar que no es lo mismo la calidad de imagen que necesite un estudioso de los textos, que uno de las tipografías o las encuadernaciones).
Evidentemente la biblioteca digital no podrá cubrir el 100% de los aspectos que pueden merecer ser estudiados en el fondo antiguo. Pero de lo que si estamos seguros, es que cuando menos elevara considerablemente el nivel de acceso a los ejemplares con respecto al sistema de acceso físico. Seguramente alguien dedicado a un estudio de materiales no encontrara toda su información en este tipo de fuentes y necesitara un contacto físico con el ejemplar. Aunque es indudable que parte de su trabajo (aunque solo sea la aproximación o la decisión sobre la pertinencia del ejemplar para su estudio) también podrá realizarse en base a las imágenes de este o a las notas que pudieran acompañarle en la descripción.
Pensemos también en que hay ejemplares que por su estado de deterioro, no son accesibles nada mas que a sus conservadores. Aprovechando las labores de conservación se aprovecha para digitalizar dichas obras estando a partir de ese momento accesibles tanto a los estudiosos especializados como al publico en general.
Una vez mas pensemos en el caso de la Biblioteca Histórica Marques de Valdecilla de la Universidad Complutense de Madrid. Mas concretamente en la Biblioteca Digital Dioscórides. A día de hoy tiene digitalizados 2.750 ejemplares a texto completo, los cuales están disponibles a todo el mundo a través de la pagina web.
Pensemos que uno de los fines revalorizados de una biblioteca es poner a disposición del publico sus fondos así como encargarse de su difusión. Gracias a la digitalización esto adquiere una nueva dimensión para el fondo antiguo.
viernes, 30 de noviembre de 2007
Biblioteca 2.0
- Mejorar continuamente
- Participar
- Compartir
- Confiar
- Reutilizar
- Inteligencia colectiva
- Usuario como creador de contenido
Según Alejandro Carrión la definición de la Biblioteca 2.0 encuadra los siguientes elementos:
- Un modelo de servicio bibliotecario
- Una filosofía de servicio
- No se basa exclusivamente en la tecnología
- Una actitud para los usuarios
Una experiencia de Biblioteca 2.0 se esta desarrollando en España, concretamente en la Biblioteca Municipal de Muskiz , esta aventura ha sido presentada en numerosos cursos, jornadas, etc..
¿ Son Posibles las Bibliotecas 2.0 ?
Juan Ramón García