30
Herramientas de Documentalistas

Presentacion Proyecto Herramienta de Documentalista

Embed Size (px)

Citation preview

Herramientas de Documentalistas

Recolector de Documentos

Recolector de Documentos

Diversidad DocumentalBlogs

Revistas electronicas

Prensa Historica

Tesis

Paginas Web

Correo electronico

RSS

Fotografias

Etc...

Recolector de Documentos

Diversidad de Formatos y Normas

PDF de Adobe

MS Office PPT, DOC, XLS

Imagenes JPG, GIF

RSS, ATOM, RSS2...

HTML, XML...

Dublin Core

HL7

Ascii, UTF-8, ANSI...

Recolector de Documentos

Recolector de Documentos ¿Que informacion se extrae?

Metadatos

Texto Completo

Informacion introducida manualmente

.....

Recolector de Documentos

Base de datos

Internet

Medios de almacenamiento como discos...

Difusion

Entrada Procesos Salida

Entrada Procesos Salida

1 Recolectar enlaces URLExtrae los enlaces URL de una pagina a partir de una direccion URL

2 Lector de XMLLee XML de medios, RSS, ATOM...

3 Importa ficheros de disco De directorios, cds, dvd..

4 Introduccion manual de registros Permite el registro manual de documentos.

1 Recolectar enlaces URLExtrae enlaces URL a partir de una direccion

2 Lector de XMLLee XML de medios,rss, atom....

3 Importa ficheros de discoDe directorios, cds, dvd..

4 Introduccion manual de registros Permite el registro manual de documentos.

El recolector hace su trabajo pero... ¿Como organizar la entrada de miles de

documentos diarios?

Desde las 16:59:10 hasta

las 16:59:12 recolecta 26 documentos.

Entrada Procesos Salida

Entrada Procesos Salida

Metodos tradicionalesTesauro, Cuadro de Clasificacion, Materias, Metadatos Dublin Core...

Tesauro

Metadatos Dublin Core

Estructura jerarquica

Cuadro de Clasificacion / Expediente / Volumen / DocumentoPublicacion / Numero / Pagina

Calculo de la materia

Calcula la materia probable comparando los terminos con una base de terminos por materia

Entrada Procesos Salida

Entrada Procesos Salida

Envio automatico a nuestra base de datos en internet

Informes y listados

Exportar a formato Wordpress y SQL

Para mas informacion sobre las funciones de HDD vease: http://funciones.wordpress.com/

CREDITOSEste es un software para uso no comercial, para otros usos consulte las respectivas licencias

Utiliza el siguiente software de apoyo, integrandolo en la gestor de base de datos:

Exiftool para la extraccion de metadatos, ExifTool by Phil Harveyhttp://www.sno.phy.queensu.ca/~phil/exiftool/

Gettext para la extraccion de texto plano de documentos, Kryloff Technologies, Inc. http://www.kryltech.com/

Vbscript y Cscript para facilitar y optimizar el uso de programas externos y para extraer XML, URL y metadatos de paginas HTMLhttp://www.microsoft.com

La base de datos esta realizada con Velneo para trabajar sobre plataformas windows.http://www.velneo.comv