Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
SOLUCIÓN TECNOLÓGICA PARA LA DIGITALIZACIÓN DE DOCUMENTOS
PRAIA, CABO VERDE 27-28/03/19
Captura de Documentos
14 years trying hard to make ECM software smarter
En España: IBEX 35
Está formado por las 35
empresas con más
liquidez que cotizan en el
Sistema de Interconexión
Bursátil Español (SIBE)
en las cuatro bolsas
españolas (Madrid,
Barcelona, Bilbao y
Valencia).
En España
Experiencia en Gobierno
Introducción al ECM
¿Qué es la captura de documentos?
Son todos los procesos, técnicas y
herramientas que nos permiten mover
documentos digitales o físicos a nuestro
sistema de gestión documental para su
almacenamiento, gestión, uso y distribución.
Documentos de distintos orígenes
CAPTURA
Documentos de distintos orígenes
Nacidos Digital Originales Papel
Captura de Emails
CAPTURA
Cuerpo del email
Captura de Emails
CAPTURA
Adjuntos
Captura de documentos de usuarios externos
CAPTURAFormularios Públicos
para adjuntar
documentación e
información
Captura de documentos de usuarios externos
CAPTURAFormularios Públicos
para adjuntar
documentación e
información
Captura de documentos de usuarios externos
CAPTURA
Recepción de
documentos en el SGD
Captura de documentos de usuarios externos
Recepción dedocumentos en el SGD
Digitalización de procesos
CAPTURA
Listos para ser
enrutados y procesados
Digitalización de procesos
CAPTURA
Completitud del
expediente
Otros mecanismos para capturar documentos digitales
● Folderes monitorizados
● Migraciones
● Carga desde interfaz individual/masiva
● API para integraciones con otros sistemas
Digitalización de documentos
CAPTURA
Digitalización de documentos
CAPTURA Centralizada Descentralizada
Digitalización de documentos
CAPTURA
Centralizada
PROS
● Archivo físico centralizado
● Libera espacio en oficinas/sucursales,
etc.
● Mayor control sobre los documentos.
● No requiere infraestructura en oficinas
(escáneres)
CONTRAS
● Costes logísticos
● Procesos más lentos si se requieren
los físicos
Digitalización de documentos
CAPTURA
Centralizada
PROS
● Archivo físico centralizado
● Libera espacio en oficinas/sucursales,
etc.
● Mayor control sobre los documentos.
● No requiere infraestructura en oficinas
(escáneres)
CONTRAS
● Costes logísticos
● Procesos más lentos si se requieren
los físicos
Vinculación entre documentos físicos y digitales
CAPTURA
Centralizada
Extracción de texto de documentos digitalizados
CAPTURA OCROptical Character Recognition
Extracción de texto de documentos digitalizados
CAPTURA
Documentos buscables
Clasificación de documentos digitalizados
CAPTURA
Clasificar automáticamente
Clasificación de documentos digitalizados
CAPTURA
Clasificar automáticamente
Extracción de datos
CAPTURA
Extracción de datos
CAPTURA
OCR NO es una tecnología 100% fiable
CAPTURA 10X0%Optical Character Recognition
CAPTURALos resultados del OCR
dependen de muchos
factores, entre ellos, la
calidad de los
documentos.
OCR NO es una tecnología 100% fiable
10X0%
Buenas Prácticas Digitalización
CAPTURADigitalizar al menos a
300dpi
Buenas Prácticas Digitalización
CAPTURA
¿Qué elementos pueden afectar la calidad de
la imagen?
● Manchas en los documentos originales
● Dobleces● formato de salida y profundidad al
escanear.
¿Qué formatos de salida recomendamos?
● TIFF
Buenas Prácticas Digitalización
CAPTURA
¿Qué pasa cuando la calidad de la imagen es
baja?
Dos procesos se ven especialmente afectados:
● Clasificación basada en expresiones textuales: Al
no poder extraerse correctamente el OCR, las
expresiones textuales tampoco se extraen bien,
por lo que la clasificación puede fallar.
● Extracción de metadatos: Es posible que no se
extraigan los metadatos o que se extraigan de
forma incorrecta.
Buenas Prácticas Digitalización
CAPTURA
¿Es lo mismo procesar una foto que una imagen
escaneada?
No, no es lo mismo. Procesar fotografías tiene mucha
más complejidad, ya que las imágenes generadas
mediante cámaras pueden tener:
● Distorsión de la perspectiva.
● Desenfoque.
● Problemas de luminosidad.
Buenas Prácticas Digitalización
CAPTURA
¿Puede Athento corregir defectos de las
imágenes?
Athento tiene operaciones que pueden corregir
defectos como los que siguen:
● Corregir la orientación del documento
● Borrar páginas en blanco
● Limpiar el OCR...etc.
Sin embargo, las correcciones tienen limitaciones, y
en muchas ocasiones no son suficientes para obtener
resultados 100% óptimos.
14 years trying hard to make ECM software smarter