Upload
abel-suing
View
1.822
Download
0
Embed Size (px)
Citation preview
Curso réplica: Recuperación de Bases de datos
documentalesUniversidad Técnica Particular de Loja
Diana RiveraCatalina Mier
Jenny Yaguache
Bases de datos y recuperación de información
• Indicadores de eficacia- Podemos encontrar mucho ruido o silencios
• Recuperación– selectiva– Eficaz– Eficiente
Bases de datos y recuperación de información
• Se debe recuperar:- Toda la información relevante- Pero sólo la relevante- con un costo razonable
* tiempo y esfuerzo* fases previas y posteriores
Operadores de expansión
• Truncar:– Raíz del término– Substituye conjunto final de caracteres– Ej: profesor*
* (profesor, profesora, profesores, profesorado…)Enmascara:*Sustituye a un carácter• Ej: Profesor?s * (profesores, profesoras, profesoros)
Operadores de expansión
• Truncar:* ExhaustividadEnmascarar:* Exhaustividad
Operadores de proximidad
• Definen la distancia máxima admisible entre dos términos
• Uso en campos textuales no contralados* Ej: informática near2 documentación* Informática y documentación* Documentación sobre una aplicación informática (NO SE HACE)
Operadores de cualificación
• Permiten especificar el campo o campos en que la condición debe satisfacerse.– Ejemplos:
• (informática documenta) EN TITULO• Unamuno EN AUTOR
Operadores de encadenamiento
• Permite emplear como parte de una ecuación los resultados de una búsqueda anterior– Por ejemplo, cada búsqueda parcial se denota
por #n– Ejemplos:
• #1:• Chaing IN AUTHOR
Operadores de encadenamiento
• Permite emplear como parte de una ecuación los resultados de una búsqueda anterior– Por ejemplo, (en azul la respuesta del sistema)– Chaing IN AUTHOR
• 45322 ref.• #2• 12784 ref.• # 3• # 2 and PUBYEAR> 2005• 97 ref.
Documentos: conceptos, definiciones y tipologías
• Documento: fuente y soporte de información:• Tipologías: diversidad de criterios
– Naturaleza información: texto, audio, imagen, etc
– Soporte físico: papel, digital, etc– Difusión: publicados, inéditos, literatura
gris, reservados de pago…Contenidos: primarios y secundarios
Documentos: conceptos, definiciones y tipologías
• Contenido: primarios y secundarios– Primarios: fuentes originales completas– Secundarios: referencias
* Resultado del tratamiento documental* Elaboración técnicas de los primarios
- Para facilitar su recuperación
Documentos: conceptos, definiciones y tipologías
• Las bases de datos contienen– Siempre referencias– Y, si es el caso, vínculos a los documentos
primarios– La búsqueda de la información se hace sobre
las referencias.
Documentos: conceptos, definiciones y tipologías
• Las bases de datos contienen– Siempre referencias– Y, si es el caso, vínculos a los documentos
primarios– La búsqueda de la información se hace sobre
las referencias.
Lenguajes documentales
• Principio básico • Papel de puente entre usuario y
documentalista • Para asegurar que unos y otros
empleanlos mismos términos para expresar los mismo conceptos.
• Así la recuperación es eficaz con mínimas tasas de ruido y silencio.
Documentos: conceptos, definiciones y tipologías
• Las bases de datos contienen– Siempre referencias– Y, si es el caso, vínculos a los documentos
primarios– La búsqueda de la información se hace sobre
las referencias.
TESAUROS
• Voz latina que significa tesoro• Acepción: como colección, repertorio• Función: Instrumento de control
terminológico del lenguaje natural de los documentos, indizadores o usuarios a un lenguaje documental más controlado.
Tesauros
• Según su estructura: vocabulario controlado y dinámico de términos relacionados semántica y genéricamente que cubre un dominio específico del conocimiento.
• Control lenguaje• Concepto: docente, profesor, enseñante,
educador, maestro, etc• Variaciones de género y número
Tesauros
• El uso del lenguaje natural:– Ruido– SilencioExhaustividad- Docente* OR profesor* OR educador*- Precisión:- ¿tutor? ¿educador de tiempo libre?- ¿cómo se busca?
Tesauros: elementros estructurales
• Unidades léxicas:ç– Descriptores– Términos equivalentes– IdentificadoresRelaciones- De equivalencia- Jerárquicas- Asociativas- definitorias
Tesauros: elementros funcionales
• Intrumentos de exhaustividad– Control de sinónimos– Normalizaciòn. Control de la forma de las
palabras.– ClasificiaciónInstrumentos de precisión:- Especificidad del lenguaje de indización- Coordinación y nivel de pre-coordinación
Tesauros: Descriptores
• Todo descriptro es una palabra –clave• Es un térmio que caracteriza el
contenido conceptual de un documento• Es una palabra – clave noramalizada,
controlada.• Término normalizado y elegido como
preferente