
El espectro de los formatos de documentos electrónicos puede ir desde las imágenes de tipo bitmap hasta los formatos de texto, o los documentos multimedia con audio y vídeo.
Cada formato posee una funcionalidad y unas características específicas que dependerán del objetivo buscado.
Formatos de imagen
Los formatos de imagen se utilizan para mostrar imágenes digitales de las páginas del texto, fotografías, ilustraciones, y cualquier otro tipo de material gráfico. Cuando hablamos de digitalización, normalmente nos estamos refiriendo a imágenes digitales de las páginas de papel. Los formatos más comunes son TIFF, GIF, y JPEG.
La información en imágenes es una copia exacta del original y no puede ser indizada (salvo tratamiento con un OCR). Son archivos no editables y por tanto, el texto no puede ser modificado fácilmente. Son muy utilizados para el intercambio y archivo ya que son soportados por cualquier software de tratamiento de imagen.
Los archivos TIFF son archivos de gran tamaño, y por ello, no son usados generalmente en Internet. Frente a ellos, los archivos JPEG permiten alcanzar un alto nivel de compresión (aunque cuanto más alta es la compresión, más baja es la calidad de la imagen), y por ello, es un formato muy extendido en Internet.
Formatos de texto
Los formatos de texto son la forma más simple de documento electrónico. Estos documentos contienen solamente una cadena de caracteres y carecen de otros elementos más sofisticados como diagramas, tablas, cuadros binarios, sonido, etc. Los estándares de codificación más comunes para el texto son ASCII, UNICODE y RTF. Éste último es compatible con todos los procesadores de texto desarrollados por Microsoft y a diferencia de los otros dos, preserva características del formato del documento original como negritas, cursivas, subrayados, notas al pie, etc.
Los formatos de texto (a diferencia del formato de imagen), sí permiten un tratamiento más fácil
Formatos de la presentación
Son formatos que se han desarrollado para presentación o impresión en pantalla. Son formatos estáticos y no contienen ninguna información de la estructura. Los formatos más comunes son PostScript y PDF.
PDF es un formato de almacenamiento de documentos relativamente nuevo y basado en PostScript. Fue desarrollado por Adobe Systems y está especialmente ideado para documentos susceptibles de ser impresos ya que especifica toda la información necesaria para su presentación final sin requerir procesos anteriores de ajuste o maquetación. Cada vez es más utilizado gracias a la gran calidad de las fuentes utilizadas y a las facilidades que ofrece para el manejo del documento, (búsquedas, hiperenlaces, ...). Adobe facilita el programa para leer este tipo de documentos.
Formatos estructurados
Son formatos que se apoyan en la utilización de marcas o etiqueta explícitas. Los formatos que encontramos en esta categoría son SGML, XML, y HTML. XML (subconjunto simplificado de SGML) se ha convertido en poco tiempo en el estándar del Sitio Web. La utilización de un formato de codificación simple y universal como XML permite perpetuar los documentos electrónicos. XML es el formato ideal ya que además de ser un formato no propietario, y por tanto ofrecer garantía de preservación de la información (ASCII), permite estructurar la información y el intercambio de información a todos los medios.
Cada formato posee una funcionalidad y unas características específicas que dependerán del objetivo buscado.
Formatos de imagen
Los formatos de imagen se utilizan para mostrar imágenes digitales de las páginas del texto, fotografías, ilustraciones, y cualquier otro tipo de material gráfico. Cuando hablamos de digitalización, normalmente nos estamos refiriendo a imágenes digitales de las páginas de papel. Los formatos más comunes son TIFF, GIF, y JPEG.
La información en imágenes es una copia exacta del original y no puede ser indizada (salvo tratamiento con un OCR). Son archivos no editables y por tanto, el texto no puede ser modificado fácilmente. Son muy utilizados para el intercambio y archivo ya que son soportados por cualquier software de tratamiento de imagen.
Los archivos TIFF son archivos de gran tamaño, y por ello, no son usados generalmente en Internet. Frente a ellos, los archivos JPEG permiten alcanzar un alto nivel de compresión (aunque cuanto más alta es la compresión, más baja es la calidad de la imagen), y por ello, es un formato muy extendido en Internet.
Formatos de texto
Los formatos de texto son la forma más simple de documento electrónico. Estos documentos contienen solamente una cadena de caracteres y carecen de otros elementos más sofisticados como diagramas, tablas, cuadros binarios, sonido, etc. Los estándares de codificación más comunes para el texto son ASCII, UNICODE y RTF. Éste último es compatible con todos los procesadores de texto desarrollados por Microsoft y a diferencia de los otros dos, preserva características del formato del documento original como negritas, cursivas, subrayados, notas al pie, etc.
Los formatos de texto (a diferencia del formato de imagen), sí permiten un tratamiento más fácil
Formatos de la presentación
Son formatos que se han desarrollado para presentación o impresión en pantalla. Son formatos estáticos y no contienen ninguna información de la estructura. Los formatos más comunes son PostScript y PDF.
PDF es un formato de almacenamiento de documentos relativamente nuevo y basado en PostScript. Fue desarrollado por Adobe Systems y está especialmente ideado para documentos susceptibles de ser impresos ya que especifica toda la información necesaria para su presentación final sin requerir procesos anteriores de ajuste o maquetación. Cada vez es más utilizado gracias a la gran calidad de las fuentes utilizadas y a las facilidades que ofrece para el manejo del documento, (búsquedas, hiperenlaces, ...). Adobe facilita el programa para leer este tipo de documentos.
Formatos estructurados
Son formatos que se apoyan en la utilización de marcas o etiqueta explícitas. Los formatos que encontramos en esta categoría son SGML, XML, y HTML. XML (subconjunto simplificado de SGML) se ha convertido en poco tiempo en el estándar del Sitio Web. La utilización de un formato de codificación simple y universal como XML permite perpetuar los documentos electrónicos. XML es el formato ideal ya que además de ser un formato no propietario, y por tanto ofrecer garantía de preservación de la información (ASCII), permite estructurar la información y el intercambio de información a todos los medios.
Silvia Fdez. de Mera
No hay comentarios:
Publicar un comentario