Información oculta en archivos MS-Office (III)

hacking77Hay programas que extraen metadatos de archivos MS-Word, WordPerfect y PDF (antiword, catdoc, strings, Metaviewer). Algunos funcionan en Windows y otros bajo Linux, y la mayor parte se caracterizan por su escasa utilidad. Si se quiere observar el contenido completo de un archivo (MS-word o de cualquier otro tipo) lo mjejor es un editor hexadecimal. También se obtienen excelentes resultados abriendo el documento con el bloc de notas de Windows (¡no con el Wordpad!).

Resulta interesante examinar un documento en tres etapas: primero visualizamos el contenido con Word y verificamos sus metadatos en el cuadro “Propiedades” (Menú Archivo/Propiedades, y dentro del mismo en la pestaña “Resumen”); acto seguido lo analizamos con una aplicación gratuitas –Pinpoint Metaviewer, disponible en la página web del desarrollador, que también muestra metadatos de documentos PDF, MP3, archivos gráficos, etc-; finalmente hurgaremos en las entrañas del archivo el editor hexadecimal HxD, también gratuito y disponible en Internet. En cada etapa el volumen de datos recuperados va siendo mayor. Un documento que únicamente exhibe información trivial en el Metaviewer (fecha, número de caracteres, etc.) puede revelar cosas verdaderamente sorprendentes al ser escudriñado con un editor hexadecimal.

Para gestionar los metadatos existen algunas aplicaciones que pueden ser manejadas como programas independiente o también como módulos de MS-Word, con su propia barra de botones dentro del procesador de textos. Ciertas utilidades muestran, por ejemplo: la lista de los diez últimos autores, el tiempo trabajado por el usuario en el documento, objetos incrustados, cambios realizados y códigos VBA pertenecientes a las macros de MS-Word. También son capaces de limpiar (“sanitize”) el archivo, o suprimir la mayor parte de la información confidencial por la vía expeditiva de la conversión en PDF.

Los resultados son desiguales. Algunas aplicaciones revelan más que otras. Conozco utilidades software que, aunque no son capaces de mostrar todo lo que se ve a través del editor hexadecimal, resultan eficaces en cuanto a la supresión masiva de metadatos, incluyendo aquellos que la propia herramienta no detecta al realizar el análisis. Los metadatos también se pueden eliminar a mano poniendo el editor hexadecimal en modo escritura y tapando la información sensible con caracteres  aleatorios o espacios de tabulador. Este método proporciona resultados seguros, si bien a costa de un riesgo de estropear el documento haciendo imposible su apertura por MS-Word.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: