Upload
alba-collado-cascales
View
264
Download
0
Embed Size (px)
DESCRIPTION
Power point sobre los corpora monolingües. Concepto, características, aplicaciones, ejemplos prácticos...
Citation preview
Alba ColladoAlba Collado
Adell El IdrissiAdell El Idrissi
¿Qué es un corpus?
• Conjunto de textos, normalmente almacenados en formato electrónico, seleccionados como elementos de referencia de una lengua o de una determinada variedad de la misma.
• Elementos de referencia para el estudio de una frase concreta o un cierto aspecto de la lengua.
¿Qué es un corpus?
• Debe cumplir unas características:
– Autenticidad– Extensión– Formato electrónico– Criterios específicos de recopilación
Tipos de corpora
• Monolingües• Bilingües• Multilingües
• Oral vs. escrito• Impreso vs. electrónico• Variaciones regionales,
sociales, etc.
Corpora monolingües
• Utilidad para el traductor:
– Búsqueda de términos en un contexto determinado.
– Consulta de estilo, fraseología, etc., en textos paralelos para mantener la función comunicativa.
– Creación de un corpus propio.
Corpora monolingües
• Funciones:
– De referencia: Bases para crear gramáticas, diccionarios, tesauros…
– Monitores: Se mantienen activos con la finalidad de permitir el estudio diacrónico de la lengua.
Conceptos
• Concordancia: Búsqueda de términos en su contexto frecuente (registro, estilo, variedad geográfica).
• Colocación: Búsqueda de elementos que suelen acompañar a ciertos términos (construcciones sintácticas, fraseología…).
Casos prácticos
Casos prácticos
Casos prácticos
Otros usosOtros usos• Adquisición de Adquisición de
conocimiento léxicoconocimiento léxico• Construcción de Construcción de
gramáticasgramáticas• Estudios Estudios
socioculturalessocioculturales• EstilísticaEstilística• Traducción automáticaTraducción automática• Reconocimiento del Reconocimiento del
hablahabla• Recuperación de Recuperación de
informacióninformación• Lexicografía Lexicografía
monolingüe y bilingüemonolingüe y bilingüe
• Construcción de Construcción de diccionarios diccionarios electrónicoselectrónicos
• Compilación de Compilación de lexicones lexicones computacionalescomputacionales
• Repositorios de Repositorios de información información terminológicaterminológica
Corpora monolingüe online
• Alemán:– COSMAS II des
Instituts für Deutsche Sprache
– Korpus des DWDS
• Francés:– Bases Corpus
Langage
• Castellano:– CREA (Últimos 25
años)– CORDE (+25)– Corpus del español
• Inglés:– British National Corpus– Corpus of
Contemporary American English