Upload
others
View
20
Download
0
Embed Size (px)
Citation preview
1
FACULTADE DE FILOLOXÍA
DEPARTAMENTO DE LINGUA E LITERATURA ESPAÑOLAS,
TEORÍA DA LITERATURA E LINGÜÍSTICA XERAL
Lingüística
Computacional
Ana Isabel Codesido García
GUÍA DOCENTE E MATERIAL DIDÁCTICO
2019/2020
2
FACULTADE DE FILOLOXÍA. DEPARTAMENTO DE LINGUA E LITERATURA
ESPAÑOLAS, TEORÍA DA LITERATURA E LINGÜÍSTICA XERAL
AUTORA: Ana Isabel Codesido García.
Edición electrónica. 2019
ADVERTENCIA LEGAL: Reservados todos os dereitos. Queda prohibida a duplicación
total ou parcial desta obra, en calquera forma ou por calquera medio (electrónico,
mecánico, gravación, fotocopia ou outros) sen consentimento expreso por escrito da
autora.
3
1. DATOS DESCRITIVOS DA MATERIA
1.1. DATOS BÁSICOS
CÓDIGO G5041608
NOME DA MATERIA LINGÜÍSTICA COMPUTACIONAL
TITULACIÓN
Grao en Filoloxía Clásica
Grao en Lingua e Literatura Españolas
Grao en Lingua e Literatura Galegas
Grao en Lingua e Literatura Inglesas
Grao en Linguas e Literaturas Modernas
CARÁCTER
OBRIGATORIA EN MINOR DE LINGÜÍSTICA
OPTATIVA (nos demais casos)
Nº DE CRÉDITOS ECTS 6
1.2. REQUISITOS
Non se requiren coñecementos previos, máis aló da formación básica adquirida
ata este momento nas materias de contido lingüístico cursadas nos diferentes Graos; a
materia está planificada para que poida ser cursada por calquera estudante da
Facultade. Recoméndase que o estudantado posúa habilidades para a lectura (con
capacidade de síntese) e comprensión crítica da información recollida en diferentes
soportes.
Tamén convén posuír un nivel medio-alto de comprensión escrita das linguas
española, galega e inglesa, xa que os materiais de consulta recomendados así como os
empregados nas sesións de clase inclúen textos publicados nestes idiomas.
Por outra banda, debe terse moi en conta que para superar a materia, ademais de
acadar o nivel requirido en canto a contidos e prácticas, será requisito indispensable
L OCALIZACIÓN F ACULTADE DE F ILOLOXÍA
( Campus de Santiago)
4
amosar na realización das diferentes probas –orais e/ou escritas– un nivel de dominio
(exposición e argumentación, redacción e ortografía) conforme coa
situación académica do estudante.
Por último, recoméndase posuír coñecementos de informática a nivel de usuario e
manexo básico da rede Internet.
1.3. PROFESORA ENCARGADA DA MATERIA
Profesora: Ana Isabel Codesido García
Área de coñecemento: Lingüística Xeral
Departamento: Lingua e Literatura Españolas, Teoría da Literatura e Lingüística
Xeral
Lingua vehicular de docencia: galego
1.4. TITORÍAS: HORARIO, LUGAR E INFORMACIÓN DE CONTACTO
Horario: Fixado ao comezo do 2.º semestre
Lugar: Gabinete 122
Teléfono: 881 811 776
Enderezo electrónico: [email protected]
2. SENTIDO DA MATERIA
Lingüística Computacional forma parte do módulo “Lingüística e procesamento
das linguas. Aplicacións”. Este módulo pódese cursar como complementario ou como
optativo, combinado con calquera dos ofrecidos por outras áreas da Facultade de
Filoloxía en función dos intereses do alumnado. Para a obtención do “Minor en
Lingüística Xeral” deberá ser combinado co bloque de materias que conforman o módulo
“Linguas e comunicación. Aplicacións”.
Así pois, e tomando como base os obxectivos xenéricos do módulo no que se insire,
a materia Lingüística Computacional introduce os estudantes nos fundamentos da
utilización de ordenadores no estudo e coñecemento das linguas, salientando a
pertinencia dos instrumentos informáticos no traballo con bases inxentes de datos
lingüísticos reais e a súa incidencia no procesamento automático destes. O sentido global
desta materia é completar a formación académica dos estudantes
5
proporcionándolles coñecementos transdisciplinares básicos relacionados cos novos
perfís profesionais demandados na sociedade actual. Deste xeito, e adoptando unha
orientación resolutiva, reflexionaremos ademais sobre a presenza das TIC nos eidos da
comunicación e das linguas, ben no ámbito propiamente da Lingüística, ben no da
Literatura, Teoría literaria, creación ou investigación filolóxica.
3. OBXECTIVOS DA MATERIA
A evolución do contexto socioeconómico nos últimos anos, prestando atención
preferente aos cambios producidos no mundo laboral nos seus diferentes aspectos e
manifestacións, xunto coas esixencias e necesidades de capacitación profesional que a
sociedade actual poida demandar dos futuros graduados, foron referente obrigado á hora
de establecérense os obxectivos da materia Lingüística computacional. Os moitos e
variados perfís profesionais propostos nos Graos impartidos na Facultade de Filoloxía,
así como tamén as competencias xenéricas e específicas que o alumnado debe posuír
para a obtención da súa titulación constitúen, polo tanto, a base sobre a que se asentan
os obxectivos da materia que a continuación se expoñen e que deberan posibilitar aos
estudantes a adquisición de conceptos e recursos para:
• Desenvolver destrezas para abordar os múltiples problemas que presenta a
linguaxe natural para o seu tratamento computacional nos seus diferentes niveis,
atendendo de xeito integrado ás perspectivas lingüística, lóxica, matemática e
informática.
• Coñecer os diferentes modelos de procesamento computacional das linguas
naturais co fin de convertelas en linguaxes automáticas.
• Achegarse aos métodos e ferramentas de traballo empírico da Lingüística actual
que permitan ao estudante manexar datos lingüísticos reais procedentes de
diversos corpus para o seu posterior tratamento informático e computacional.
• Coñecer os recursos relacionados co tratamento computacional da linguaxe (bases
de datos, ferramentas de análise textual, programas de tradución automática,
sistemas de ditado automático, etc.).
6
• Analizar estes recursos e os resultados obtidos a partir do seu manexo e aplicación
co fin de poder valoralos criticamente de acordo cos coñecementos teóricos e
metodolóxicos adquiridos.
4. COMPETENCIAS
Ademais das competencias xerais propias dos estudos universitarios e
especificadas nos títulos de Grao, os estudantes desta materia deberan acadar as
seguintes competencias específicas:
4.1.1.Competencias disciplinares cognitivas (saber)
(1) Capacidade de reflexión crítica sobre as relacións entre as linguas e as novas
tecnoloxías.
(2) Adquisición das bases teórico-metodolóxicas da Lingüística Computacional.
(3) Coñecemento das ferramentas, aplicacións e recursos de natureza diversa
desenvolvidas por e para o estudo computacional das linguas.
(4) Comprensión, avaliación e aproveitamento destas ferramentas e recursos.
4.1.2. Competencias profesionais procedimentais (saber facer)
(1) Manexo eficaz dos recursos técnicos sobre linguas e comunicación –incluídos os
accesibles en liña– en particular os orientados á investigación e á formación en
ámbitos lingüísticos, literarios, de creación ou de investigación filolóxica.
(2) Capacidade para poñer en práctica algúns dos coñecementos adquiridos en
ámbitos como: tradución automática, confección e explotación de corpora lingüísticos, e
recoñecemento e síntese de fala.
4.1.3. Competencias académicas actitudinais (ser)
(1) Capacidade para poñer en relación as distintas disciplinas nas que se sustenta o
estudo computacional das linguas.
(2) Interese pola diversidade lingüística e cultural e sensibilidade na valoración das
súas repercusións no manexo e deseño de ferramentas computacionais para o estudo dos
fenómenos comunicativos.
7
(3) Capacidade para analizar, valorar e promover as aplicacións técnicas de
comunicación multimodal naqueles casos de trastornos comunicativos derivados de
lesións motoras e/ou sensoriais.
(4) Desenvolvemento dunha actitude crítica perante o manexo e xestión das TIC e da
Internet nos ámbitos académico, investigador e profesional.
5. CONTIDOS DA MATERIA
5.1. TEMARIO
TEMA 1. Lingüística Computacional: evolución historiográfica e principais liñas de
investigación.
TEMA 2. Utilidades informáticas en Lingüística e desenvolvementos da Lingüística de
Corpus como metodoloxía de base empírica.
TEMA 3. Procesamento da linguaxe natural e Tradución automática.
TEMA 4. Tratamento da lingua –falada e escrita– e desenvolvemento de produtos
comerciais: lingüística e tecnoloxía.
5.2. BIBLIOGRAFÍA
5.2.1. RECURSOS XERAIS: DICIONARIOS, PANORÁMICAS E ENCICLOPEDIAS DE
LINGÜÍSTICA COMPUTACIONAL
AGUADO, G. (1993), Diccionario comentado de terminología informática, Madrid:
Paraninfo.
BAKER, P., A. HARDIE & T. MCENERY (2006), A glossary of corpus linguistics, Edinburgh:
E.U.P.
DALE, R., H. MUYSI & H. SOMERS (eds.) (2000), Handbook of Natural Language
Processing, New York/Basilea: Marcel Dekker, Inc.
INDURKHYA, N. & F.J. DAMERAU (eds.) (2010), Handbook of Natural Language
Processing, Boca Ratón, CRC.
LÜDELING, A. & M. KYTÖ (eds.) (2008), Corpus linguistics: an international handbook.
Vol. 1, Berlin/NY: Mouton de Gruyter.
LÜDELING, A. & M. KYTÖ (eds.) (2009), Corpus linguistics: an international handbook.
Vol. 2, Berlin/NY: Mouton de Gruyter.
8
MARCOS MARÍN, F. (1994), Informática y Humanidades, Madrid: Gredos.
MARTÍ, M.ª A. (coord.) (2003), Tecnologías del lenguaje, Barcelona: UOC.
MITKOV, R. (ed.) (2003), The Oxford Handbook of Computational Linguistics, Oxford:
O.U.P.
O'KEEFFE, A. & M. MCCARTHY (eds.) (2010), The Routledge Handbook of Corpus
Linguistics, London: Routledge.
WILSON, R.A. & F. C. KEIL (eds.) (2002), Enciclopedia MIT de ciencias cognitivas, Madrid:
Síntesis.
5.2.2. INTRODUCIÓNS Á LINGÜÍSTICA COMPUTACIONAL
BARNBROOK, G. (1996), Language and Computers. A Practical Introduction to the
Computer Analysis of Language, Edinburgh: E.U.P.
CHIARI, I. (2007), Introduzione alla linguistica computazionale, Roma: Laterza.
GÓMEZ GUINOVART, J. (1998) "Fundamentos de lingüística computacional: bases
teóricas, líneas de investigación y aplicaciones", en P. Cid & J. Baró (eds.) Anuario
SOCADI de Documentación e Información 1998, Barcelona: Societat Catalana de
Documentació i Informació, 135-146.
GÓMEZ GUINOVART, J. & M. PALOMAR (coords.) (1998), Monografía: Lengua y Tecnologías
de la Información. Novática, Revista de la Asociación de Técnicos de Informática,
133 (Mayo-Junio), 3-45.
GÓMEZ GUINOVART, X. (2000), “Lingüística computacional”, en F. Ramallo, G. ReiDoval
& X.P. Rodríguez Yáñez (eds.), Manual de Ciencias da Linguaxe, Vigo: Xerais,
221-286. [http://webs.uvigo.es/sli/arquivos/xerais.pdf]
GOMEZ GUINOVART, X. et al. (eds.) (1999), Panorama de la investigación en lingüística
informática. Monografía de Revista Española de Lingüística Aplicada.
GRISHMAN, R. (1986). Computational Linguistics, Cambridge: C.U.P. [Trad. esp. A.
Moreno Sandoval (1991), Introducción a la lingüística computacional, Madrid:
Visor]
HAUSSER, R. (2001 [1999]): Foundations of Computational Linguistics: HumanComputer
Communication in Natural Language, 2ª ed., revisada y ampliada, Berlin:
Springer-Verlag.
9
KAWAGUCHI, Y. et al. (2005), Linguistic informatics: state of the art and the future,
Amsterdam/Philadelphia: John Benjamins.
LAVID, J. (2005), Lenguaje y nuevas tecnologías: nuevas perspectivas, métodos y
herramientas para el lingüista del siglo XXI, Madrid: Cátedra.
LAWLER, J. & H. ARISTAR DRY (eds.) (1998): Using Computers in Linguistics. A Practical
Guide, London/New York: Routledge.
LLISTERRI, J. (2003), "Lingüística y tecnologías del lenguaje", Lynx. Panorámica de
Estudios Lingüísticos, 2, 9-71
[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_03_Linguistica_Tecnologias
_Lenguaje.pdf]
MARTÍ, M.ª A. & I. CASTELLÓN (2001), La lingüística computacional, Barcelona:
Edicions Universitat de Barcelona.
MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías: el campo de la
lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. USC, 147-227.
[http://liceu.uab.es/~joaquim/publicacions/Llisterri_Moure_96_Linguistica_Com
putacional.pdf]
TOMASI, F. (2009), Metodologie informatiche e discipline umanistiche, Roma: Carocci.
TORDERA, J.C. (2012), El abecé de la Lingüística computacional, Madrid: Arco/Libros.
5.2.3. OUTRAS REFERENCIAS DE INTERESE (AGRUPADAS POR ÁMBITOS)
5.2.3.1. Lingüística de corpus
BARLOW, M. (2001), “Corpus linguistics and theoretical linguistics”, International
Journal of Computational Linguistics, 16:1, 3-44.
KAWAGUCHI, Y. et al. (2007), Corpus-based perspectives in Linguistics,
Amsterdam/Philadelphia, PA: John Benjamins.
LLISTERRI, J. et al. (2005), "Corpus orales para el desarrollo de las tecnologías del
habla en español", Oralia. Análisis del discurso oral, 8, 289-325.
MCENERY, T. & A. WILSON (1996, 20012), Corpus Linguistics: an introduction,
Edinburgh: E.U.P.
[http://www.lancs.ac.uk/fss/courses/ling/corpus/CONTENTS.HTM]
10
MCENERY, T. & A. HARDIE (2011). Corpus linguistics: Method, theory and practice.
Cambridge: C.U.P..
MCENERY, T., R. XIAO & Y. TONO (2006): Corpus-Based Language Studies: an advanced
resource book, London/New York: Routledge.
PARODI, G. (2010), Lingüística de Corpus: de la teoría a la empiria, Madrid:
Iberoamericana.
SARDINHA, T. B. (2004), Lingüística de Corpus, Barueri-São Paulo: Manole.
TEUBERT, W. & R. KRISHNAMURTHY (eds.) (2007), Corpus linguistics: critical concepts in
linguistics, London: Routledge.
TORRUELLA, J. (2017), Lingüística de corpus: génesis y bases metodológicas de los
corpus (históricos) para la investigación en Lingüística, Frankfurt am Main:
Peter Lang.
WILSON, A., P. RAYSON & T. MCENERY (eds.) (2003), A rainbow of corpora: corpus
linguistics and the language of the world, München: Lincom.
WYNNE, M. (ed.) (2005), Developing Linguistic Corpora: a Guide to Good Practice,
Oxford: Oxbow Books [http://www.ahds.ac.uk/creating/guides/linguistic-
corpora/index.htm]
5.2.3.2. Procesamento da linguaxe natural e Tradución automática
COLEMAN, J. (2005), Introducing Speech and Language Processing,
Cambridge/NewYork: C.U.P.
HOCKEY, S. (2001), Electronic texts in the humanities. Principles and practices, Oxford:
O.U.P.
HUTCHINS, W. J. (1986): Machine translation: past, present, future, Chichester, Ellis
Horwood: Ellis Horwood Series in Computers and their Applications.
[http://www.hutchinsweb.me.uk/PPF-TOC.htm]
HUTCHINS, W.J. & H.L. SOMERS (1995), Introducción a la traducción automática,
Madrid: Visor.
HUTCHINS, W.J. (2005), Publications on machine translation, computer-based
translation technologies, linguistics and other topics [dispoñíbel en
http://www.hutchinsweb.me.uk]
11
JURAFSKY, D. & J. H. MARTIN (20092), Speech and Language Processing. An Introduction
to Natural Language Processing, Computational Linguistics and Speech
Recognition, Upper Saddle River, NJ: Pearson Prentice Hall.
MARTÍ, M.ª A. & J. LLISTERRI (eds.) (2002), Tratamiento del lenguaje natural: tecnología
de la lengua oral y escrita, Soria/Barcelona: Fundación Duques de Soria/Edicions
Universitat de Barcelona.
MARTÍ, M.ª A. & J. LLISTERRI (eds.) (2004), Tecnologías del texto y del habla, Barcelona:
Edicions Universitat de Barcelona.
MORENO, L. et al. (1999), Introducción al procesamiento del lenguaje natural, Alacant:
Universitat de Alacant.
NIRENBURG, S. (ed.) (1987), Machine Translation. Theoretical and Methodological
Issues, Cambridge: C.U.P.
OLIVER, A., J. MORÉ & S. CLIMENT (coords.) (2007), Traducción y tecnologías, Barcelona:
Editorial UOC.
OLIVER, A. (2016), Herramientas tecnológicas para traductores, Barcelona: Editorial
UOC.
TORDERA, J.C. (2011), Lingüística computacional. Análisis, generación y traducción
automática (Anexo 20 de Lynx), València: Universitat de València.
TORDERA, J.C. (2011), “Puentes entre la lingüística computacional y la psicolingüística”,
Revista de Lingüística y Lenguas Aplicadas, 6, 341-352.
[https://polipapers.upv.es/index.php/rdlyla/article/view/914/984]
5.2.3.3. Tecnoloxías lingüísticas
AGUILERA, S. et al. (2001), “Aplicaciones sociales de las tecnologías de la lengua”, Quark.
Ciencia, Medicina, Comunicación y Cultura, 21, 90-94.
[http://www.prbb.org/quark/21/021090.htm]
CAL, M., P. NÚÑEZ & I. PALACIOS (eds.) (2005), Nuevas tecnologías en lingüística,
traducción y enseñanza de lenguas, Santiago de Compostela: Universidade de
Santiago de Compostela, Servizo de Publicacións e Intercambio Científico.
COLE, R. A. et al. (eds.) (1997), Survey of the State of the Art in Human Language
Technology, Cambridge: C.U.P. [http://www.dfki.de/~hansu/HLT-Survey.pdf]
12
LLISTERRI, J. (2003), "Las tecnologías del habla: Entre la ingeniería y la lingüística", en
Actas del Congreso Internacional ‘La ciencia ante el público. Cultura humanista y
desarrollo científico tecnológico’, Salamanca: Instituto Universitario de Estudios
de la Ciencia y la Tecnología, 44-67. [Ed. en CD_ROM]
[http://liceu.uab.es/~joaquim/publicacions/Llisterri_03_Tecnologias_Habla_Inge
nieria_Linguistica.pdf]
LLISTERRI, J. (2006), "Introducción a los sistemas de diálogo", en J. Llisterri & M.J.
Machuca (eds.) Los sistemas de diálogo, Bellaterra-Soria: UAB, Servei de
Publicacions - Fundación Duques de Soria (Manuals de la UAB, Lingüística,
45), 11-21.
[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_06_Sistemas_Dialogo.pdf]
MARTÍ, M.ª A. et al. (2004), “Tecnologies de la llengua i las seves aplicacions”, Revista
Gallega de Filología, 5, 107-139.
MARTÍ, M.ª A. & J. LLISTERRI (2001), “La ingeniería lingüística en la sociedad de la
información”, Digithum, 3.
https://digithum.uoc.edu/articles/abstract/10.7238/d.v0i3.595/]
SIEMENS, R. & S. SCHREIBMAN (eds.) (2007), A companion to digital literary studies,
Malden: Blackwell.
TORDERA, J.C. (2011), Linguistica computacional. Tecnologias del habla. València:
Universitat de València.
VARILE, G. & A. ZAMPOLLI (eds.) (1997), Survey of the State of the Art in Human
Language Technology, Cambridge: C.U.P.
VIDAL BENEYTO, J. (dir.) (1991), Las industrias de la lengua, Madrid: Fundación Sánchez
Ruipérez / Pirámide.
13
5.3. ESTRUTURA DETALLADA DO TEMARIO (SESIÓNS EXPOSITIVAS, INTERACTIVAS E
TITORÍAS)
TEMA 1. Lingüística Computacional: evolución historiográfica e principais
liñas de investigación.
OBXECTIVOS: presentar ao estudantado argumentos que xustifiquen a necesidade do
deseño e posterior manexo de diversas ferramentas informáticas nas investigacións
lingüísticas a partir da reflexión sobre posibles problemas reais derivados do uso das
linguas e que piden solución.
CONTIDOS
1. Introdución ao campo da Lingüística Computacional: evolución
historiográfica e principais liñas de investigación.
1.1. Lingüística e Informática; Lingüística e Intelixencia artificial.
1.2. A Lingüística Computacional no seo da Lingüística aplicada: caracterización e
historiografía
2. O carácter transdisciplinar da Lingüística Computacional: vertentes de
estudo
2.1. Lingüística informática: ferramentas de manipulación e análise de datos, dicionarios
automáticos, deseño e explotación de corpus lingüísticos.
2.2. Procesamento da linguaxe natural e tradución automática.
2.3. Tecnoloxías (do texto e da fala) e Industrias da lingua.
BIBLIOGRAFÍA BÁSICA
MORENO FERNÁNDEZ, F. (1990), “Lingüística informática e informática lingüística”,
Lingüística Española Actual, 12/1, 5-16.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la
lingüística computacional”, en M. Fernández Pérez (coord.), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de
Santiago de Compostela, 147-227 (aptdos. 1, 3.2.1.1. e 5).
ROJO, G. (2005-2006), “Informática y Lingüística: Las lenguas en la sociedad del
14
conocimiento”, Boletín de RedIRIS, 74-75.
[http://www.rediris.es/rediris/boletin/74-75/ponencia1.pdf]
BIBLIOGRAFÍA COMPLEMENTARIA
ARES, F. (2008), El robot enamorado. Una historia de la Inteligencia Artificial,
Barcelona: Ariel. [caps. 7 e 11]
LAHOZ-BELTRÁ, R. (2005), Turing. Del primer ordenador a la inteligencia artificial,
Madrid: Nivola.
MCCARTHY, J. (2007), What is Artificial Intelligence?
[http://www-formal.stanford.edu/jmc/whatisai/]
MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis. [caps. 1 e 2]
MORENO SANDOVAL, A. (2016), “Lingüística Computacional”, en J. Gutiérrez-Rexach
(ed.) Enciclopedia de Lingüística Hispánica, Vol. 1, London: Routledge, 204-215.
SINCLAIR, J. (2001), Corpus, Concordance, Collocation, Oxford: O.U.P.
VIDAL, J. & J. BUSQUETS (1996), “Lingüística computacional”, en C. Martín Vide (ed.),
Elementos de Lingüística, Barcelona: Octaedro Universidad, 392-446.
ORGANIZACIÓN DAS SESIÓNS EXPOSITIVAS E INTERACTIVAS
- 3 sesións expositivas nas que se desenvolverán as seguintes actividades:
• explicación dos contidos do tema
• discusión de lecturas obrigatorias
- 3 sesións seminario:
• (1.1.) Presentación e organización da materia: explicación do contido de
seminarios e titorías así como tamén da maneira como se vai avaliar o traballo
dos estudantes.
• (1.2.) Traballo de discusión (en pequeno grupo) baseado en material diverso sobre
o ámbito de estudo da Lingüística Computacional: problemas de delimitación da
disciplina, distintas aproximacións segundo vertentes, cuestións
terminolóxicas.
• (1.3.) Posta en común e análise de diferentes tipos de materiais relacionados co
campo da Intelixencia Artificial.
15
TEMA 2. Utilidades informáticas en Lingüística e desenvolvementos da
Lingüística de corpus como metodoloxía de base empírica.
OBXECTIVOS: presentar aos estudantes a utilización instrumental da informática
naqueles estudos de corte lingüístico caracterizados polo manexo cuantitativo dos datos.
Insistirase en considerar o ordenador como ferramenta que dinamiza e economiza o
traballo con grandes bases de datos lingüísticos.
CONTIDOS
1. Introdución
1.1. Ubicación do campo da Lingüística informática dentro dos estudos en Lingüística
computacional.
1.2. Panorámica das utilidades informáticas en Lingüística.
2. Transcrición de interaccións comunicativas (o sistema CHILDES)
2.1. Linguaxe adulta (de interese para Pragmática, Análise do discurso, Dialectoloxía,
Sociolingüística, Ensino/Aprendizaxe de linguas, Planificación lingüística).
2.2. Linguaxe infantil (de interese para Psicolingüística evolutiva, Lingüística clínica,
Ensino/Aprendizaxe de linguas, Planificación lingüística). 3. Ferramentas de
manipulación e análise de datos
3.1. Índices e frecuencias.
3.2. Concordancias e colocacións.
4. Desenvolvementos da Lingüística de Corpus como metodoloxía de base
empírica:
4.1. Recursos, ferramentas e aplicacións en Lingüística computacional.
4.2. Tipos e utilidade dos corpus.
4.3. Procesos de enriquecimento e extracción de información dun corpus:
segmentación, análise, tipificación, etiquetado.
5. Lexicografía computacional:
5.1. Bancos de datos lexicográficos.
5.2. Dicionarios electrónicos.
16
BIBLIOGRAFÍA BÁSICA
MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis (28-29; 130-
141).
PARODI, G. (2008), “Lingüística de Corpus: una introducción al ámbito”, Revista de
Lingüística Teórica y Aplicada, 46/1, 93-119.
TORRUELLA, J. & J. LLISTERRI (1999), "Diseño de corpus textuales y orales", en J.M.
Blecua et al. (eds.) Filología e informática. Nuevas tecnologías en los estudios
filológicos. Barcelona: UAB / Milenio, 45-77.
[http://liceu.uab.cat/~joaquim/publicacions/Torruella_Llisterri_99.pdf]
BIBLIOGRAFÍA COMPLEMENTARIA
ABAITÚA, J. (2002), “Tratamiento de corpora bilingües”, en M.ª A. Martí & J. Llisterri
(eds.) (2002), Tratamiento del lenguaje natural: tecnología de la lengua oral y
escrita, Soria: Fundación Duques de Soria; Barcelona: Edicions Universitat de
Barcelona, 61-90.
ÁGUILA ESCOBAR, G. (2009), Los diccionarios electrónicos del español, Madrid:
Arco/Libros, S.L.
FERNÁNDEZ PÉREZ, M. (2011), Lingüística de corpus y adquisición de la lengua, Madrid:
Arco/Libros.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la
lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de
Santiago de Compostela, 147-227 (esp. 148, 151, 174-177; 151, 174-177; 198-202).
PRIETO, S., E. MOSQUEIRA & N. VÁZQUEZ (2009): “Córpora y enseñanza de lenguas: se
buscan colocaciones”, en P. Cantos & A. Sánchez (eds.), A Survey of Corpusbased
Research. Panorama de investigaciones basadas en corpus, AELINCO,
Murcia, 366-373.
[http://www.dicesp.com/app/webroot/files/file/Prieto%20et%20al_2009.pdf]
SINCLAIR, J. (2005), “Corpus and Text: Basic Principles”, en M. Wynne (ed.), Developing
Linguistic Corpora: a Guide to Good Practice, Oxford: Oxbow Books: 1-16.
[http://www.ahds.ac.uk/creating/guides/linguistic-corpora/chapter1.htm]
17
TEUBERT, W. (2005), “My version of corpus linguistics”, International Journal of Corpus
Linguistics, 10/1, 1-13.
VIDAL BENEYTO, J. (1991), Las industrias de la lengua, Madrid: Fundación Germán
Sánchez Ruipérez-Pirámide (caps. 3, 4, 5 e 8).
VINCZE, O., E. MOSQUEIRA & M. ALONSO (2011), "An online collocation dictionary of
Spanish", en I. Boguslavsky e L. Wanner (eds.), Proceedings of the 5th
International Conference on Meaning-Text Theory (Barcelona), 275-286.
[http://www.dicesp.com/app/webroot/files/file/MTT%202011%20Vincze%20et%20
al_.pdf]
ZULAICA HERNÁNDEZ, I. (2016), “Lingüística de Corpus”, en J. Gutiérrez-Rexach (ed.)
Enciclopedia de Lingüística Hispánica, Vol. 1, London: Routledge, 216-224.
ORGANIZACIÓN DAS SESIÓNS EXPOSITIVAS E INTERACTIVAS
- 5 sesións expositivas nas que se desenvolverán as seguintes actividades:
• explicación dos contidos do tema
• discusión de lecturas obrigatorias
• análise de supostos prácticos
- 5 sesións seminario nas que os estudantes realizarán coa profesora as seguintes
actividades:
• (2.1.) Revisión e análise dos diferentes tipos de ferramentas informáticas de
análise textual.
• (2.2.) Traballo con corpus (I): Actividades destinadas a familiarizar os estudantes
co manexo dos corpus lingüísticos informatizados e reflexionar sobre o seu valor
e utilidade (teórica e práctica).
• (2.3.) Traballo con corpus (II): posta en común e discusión de exercicios do
seminario 2.2.
• (2.4.) Traballo con corpus (III): posta en común e discusión de exercicios do
seminario 2.3.
• (2.5.) Actividades destinadas a familiarizar os estudantes co manexo de bancos
de datos lexicográficos e dicionarios electrónicos.
18
TEMA 3. Procesamento da linguaxe natural e Tradución automática.
OBXECTIVOS: introducir os estudantes no tratamento computacional das linguas
naturais a través da comprensión e comparación dos distintos modelos de procesamento
que nos permite convertelas en linguaxes automáticas.
CONTIDOS
1. Introdución
1.1. O tratamento computacional das linguas: do natural ao automático.
2. A tradución automática
2.1. Historiografía do ámbito da tradución automática.
2.2. Tradución automática fronte a tradución asistida por ordenador.
2.3. Clasificación dos sistemas de tradución automática: criterios e tipoloxía.
2.4. A tradución automática en liña.
3. Procesamento da linguaxe natural (oral e escrita)
3.1. Introdución ao procesamento da linguaxe natural. Os procesos de recoñecemento e
síntese. Os sistemas de diálogo.
3.2. Procesamento da linguaxe natural escrita: as tecnoloxías do texto.
3.3. Procesamento da linguaxe natural oral: as tecnoloxías da fala.
3.4. Aplicacións do procesamento da linguaxe natural: presente e futuro.
BIBLIOGRAFÍA BÁSICA
ALONSO, J.A. (2003), “La traducción automática”, en M.ª A. Martí (coord.), Tecnologías
del Lenguaje, Barcelona: UOC, 94-129.
PERIÑÁN, C. (2005), “Procesamiento del lenguaje natural: de lingüista a ingeniero del
conocimiento”, en I. K. Brady, M. Navarro & C. Periñán (eds.), Nuevas Tendencias en
Lingüística Aplicada, Murcia: Quaderna, 293-317.
RUIZ, J. C. (2005), “Lenguaje e informática/Lenguaje y ordenadores”, en Á. López & B.
Gallardo (eds.), Conocimiento y lenguaje, València: Universitat, 401-436.
19
BIBLIOGRAFÍA COMPLEMENTARIA
ABAITUA, J. (1997-2001), “Presente y futuro de la traducción automática”
[http://paginaspersonales.deusto.es/abaitua/konzeptu/ta/ta97.htm]
ADOLPHS, S. (2006), Introducing Electronic Text Analysis. A practical guide for language
and literary studies, London/New York: Routledge.
HUTCHINS, J. (2003), “Machine Translation: General Overview”, en R. Mitkov, (ed.) The
Oxford Handbook of Computational Linguistics. New York/Oxford: O.U.P., 501-
511.
LLISTERRI, J. (2006), "Introducción a los sistemas de diálogo", en J. Llisterri & M.J.
Machuca (eds.), Los sistemas de diálogo, Bellaterra - Soria: UAB, Servei de
Publicacions-Fundación Duques de Soria (Manuals de la UAB, Lingüística, 45),
11-21. [http://liceu.uab.cat/~joaquim/publicacions/Llisterri_06_Sistemas_Dialogo.pdf]
MORENO, L. & MOLINA, A. (1999): “Preliminares y tendencias en el Procesamiento del
Lenguaje Natural”, Inteligencia Artificial, 3/7, 65-76.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la
lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de
Santiago de Compostela, 147-227 (esp. para PLN: §3 (3.1.1., 3.1.2., 3.1.5.; 3.2.2.;
3.2.3.) e para TA: §3 (3.2.1.))
OLIVER, A. (2006), “La traducció automàtica a Internet”, Revista Tradumàtica -
Traducció i Tecnologies de la Informació i la Comunicació. 04: La Traducció
Automàtica.
https://ddd.uab.cat/pub/tradumatica/15787559n4/15787559n4a7.pdf
VALLEZ, M. & R. PEDRAZA-JIMÉNEZ (2007), “El Procesamiento del Lenguaje Natural en
la Recuperación de Información Textual y áreas afines”, Hipertext.net, 5
[http://www.hipertext.net]
ORGANIZACIÓN DAS SESIÓNS EXPOSITIVAS E INTERACTIVAS
- 5 sesións expositivas nas que se desenvolverán as seguintes actividades:
• explicación dos contidos do tema
20
• discusión de lecturas obrigatorias
• análise de supostos prácticos
- 5 sesións seminario nas que os estudantes realizarán coa profesora:
• (3.1. e 3.2.) Tradución automática (I): Actividades destinadas a familiarizar os
estudantes cos sistemas de TA e reflexionar sobre o seu valor e utilidade (teórica
e práctica).
• (3.3.) Tradución automática (II): Actividades de aplicación de métodos e
estratexias para valorar as traducións automáticas en liña.
• (3.4. e 3.5.) Procesamento da linguaxe natural: posta en común e análise de
diferentes tipos de programas de PLN aplicados a diferentes linguas e
compoñentes destas.
TEMA 4. Tratamento da lingua –falada e escrita– e desenvolvemento de
produtos comerciais: lingüística e tecnoloxía.
OBXECTIVOS: presentar ao estudantado dous terreos que se relacionan na medida en
que un deles, o das chamadas Tecnoloxías da fala, céntrase no deseño de procedementos
variados que permiten a comunicación natural entre persoas e máquinas mediante a
fala, en tanto que o outro, o das Industrias lingüísticas, engloba unha serie de produtos
e aplicacións enfocadas dende e cara á vertente escrita.
CONTIDOS
1. Introdución
1.1. Situación do campo das Tecnoloxías e Industrias lingüísticas no seo da
Lingüística Computacional. Relación destas dúas vertentes cos eidos da
Tecnoloxía de
comunicacións e da Enxeñaría lingüística.
1.2. Panorámica actualizada das vertentes de aplicación en Tecnoloxías da fala e
Industrias da lingua.
2. Tecnoloxías da fala
2.1. Introdución.
21
2.2. Aplicacións: Síntese da fala, Recoñecemento da fala. Tradución oral
automática,.
Identificación e/ou verificación da identidade dos interlocutores.
2.4. Sistemas de diálogo persoa-máquina.
3. Industrias da lingua
3.1. Introdución.
3.2. Aplicacións: Conversión de texto a fala; ditado automático; recuperación,
procura e extracción de información; produción asistida por ordenador (PAO)
e edición electrónica, e produtos multimedia; tradución automática e asistida;
correctores (ortográficos, gramaticais e estilísticos) e verificadores; tesauros
e dicionarios electrónicos; tratamento multilingüe de textos; ELAO (Ensino
de Linguas Asistido por Ordenador); aplicacións da Enxeñaría lingüística á
axuda a discapacitados (tratamento da escritura, lectura óptica, sistemas
alternativos de comunicación), Tecnoloxía e xestión do multilingüismo.
BIBLIOGRAFÍA BÁSICA
LLISTERRI, J. et al. (2003), “El papel de la lingüística en el desarrollo de las tecnologías
del habla”, en M. Casas (dir.) & C. Varo (ed.), VII Jornadas de Lingüística, Cádiz:
Servicio de Publicaciones Universidad de Cádiz, 137-191.
LLISTERRI, J. (2007), "El español y las nuevas tecnologías", en M. Lacorte (ed.)
Lingüística aplicada del español. Madrid: Arco/Libros (Biblioteca Philologica),
483-520.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías: el campo de la
lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de
Santiago, 147-227. (esp. §§ 1.1.3, 1.1.4, 2, 3.2.5, 4).
BIBLIOGRAFÍA COMPLEMENTARIA
ABRIL, D., C. DELGADO & Á. Vigara (2009), Comunicación Aumentativa y Alternativa.
Guía de referencia, Madrid: CEAPAT
[http://sid.usal.es/idocs/F8/FDO21102/com_aumentativa.pdf].
22
LLISTERRI, J. et al. (2005), “Corpus orales para el desarrollo de las tecnologías del habla
en español”, Oralia. Análisis del discurso oral, 8, 289-325.
[http://liceu.uab.es/~joaquim/publicacions/Llisterri_Machuca_Mota_Riera_Rios_05_Cor
pus_Orales_Tecnologias_Habla_Espanol.pdf]
LLISTERRI, J. (2009), “Las tecnologías del habla en las lenguas románicas ibéricas”,
Studies in Hispanic and Lusophone Linguistics, 2 (1), 133-180.
[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_09_Tecnologias_Habla_Len
guas_Romanicas_Ibericas.pdf]
MARTÍ, M.ª A. (2003) (coord.), Tecnologías del Lenguaje, Barcelona: UOC.
MARTÍ, M.ª A. (2009) “Llengües minoritzades i tecnologia lingüística: perspectives de
futur”, Llengua, Societat i Comunicació, 7
[http://revistes.ub.edu/index.php/LSC/issue/view/268]
VIDAL VILLALBA, J. & J. BUSQUETS RIGAT (1996), “Lingüística computacional”, en C.
Martín Vide (ed.) (1996), Elementos de lingüística, Barcelona: Octaedro, 393-446
(esp. §§ 3.1, 4.1, 4.2, 4.3, 4.5, 4.6, 5)
ORGANIZACIÓN DAS SESIÓNS EXPOSITIVAS E INTERACTIVAS
- 3 sesións expositivas nas que se desenvolverán as seguintes actividades:
• explicación dos contidos do tema
• discusión de lecturas obrigatorias
• análise de supostos prácticos
- 3 sesións seminario nas que se levará a cabo, coa supervisión da profesora, unha
actividade individual na que o estudante debe escoller unha das posibles aplicacións
das tecnoloxías lingüísticas e, conxugando as pesquisas na Internet coa revisión
dalgunhas lecturas propostas, preparar un traballo que ha de ser exposto no seminario
3.3. (Cfr. Aptdo. 6 desta Guía).
TITORÍAS PROGRAMADAS
A profesora desenvolverá as seguintes titorías en grupos reducidos:
TITORÍA 1 (1.ª quenda de febreiro): organización dos grupos, distribución das lecturas
e orientacións para a realización dos traballos relacionados cos temas 2 e 3.
23
TITORÍA 2 (2.ª quenda de abril): revisión e orientación da elaboración dos traballos en
curso.
6. METODOLOXÍA
Nesta materia adoptaremos unha metodoloxía de ensino presencial que garanta a
interacción entre a profesora e o alumnado sen que isto supoña minusvalorar o proceso
de aprendizaxe autónoma. Así, o curso de Lingüística Computacional desenvolverase a
través das clases presenciais (3 h. semanais) e do traballo persoal dos estudantes en
horas non presenciais (estudo do temario a través das lecturas e
preparación dos exercicios de aplicación).
As clases presenciais serán de tres tipos:
1. Sesións expositivas (1 hora), nas que a profesora proporcionará a información
teórica básica dos temas do programa, reforzada coa presentación de diversos materiais
representativos dos conceptos estudados. Máis concretamente, asignamos a cada tema
desta materia unha serie de lecturas obrigatorias que presentan con claridade os
contidos teórico-prácticos sobre o procesamento lingüístico e as súas aplicacións
informáticas.
2. Sesións seminario (2 horas), dedicadas, dun lado, á posta en común e discusión
das lecturas obrigatorias do programa para comprobar a asimiliación dos contidos e,
doutro, á presentación e avaliación dos exercicios de aplicación propostos.
3. Titorías programadas (hora e media) en grupos reducidos co obxectivo de guiar
o traballo autónomo dos estudantes.
Como complemento das sesións expositivas e interactivas, habilitarase unha aula
virtual que se utilizará para o depósito dos materiais dixitais que a profesora vaia
disponibilizando ao longo do curso e para difundir calquera tipo de información.
Os exercicios de aplicación que os estudantes elaborarán nas horas non presenciais
responderán aos seguintes tipos:
a) Resposta a cuestións breves relacionadas co contido dos temas, que
obriguen a enfrontarse cos aspectos de máis difícil comprensión para aclarar as
24
posibles dúbidas ou que sirvan de aplicación práctica de conceptos explicados nas
sesións expositivas.
b) Revisión crítica de distintas fontes documentais relacionadas cos
contidos da materia.
Tamén elaborarán un traballo sobre algunha das aplicacións existentes no terreo
das tecnoloxías lingüísticas (estudadas ao longo de todo o curso e dun xeito máis
específico no Tema 4), que debera será presentado nas últimas sesións do curso. Se ben
todos os detalles deste tipo de proba serán presentados pola profesora ao comezo do
semestre, os estudantes deberán ser quen de demostrar a asimilación dos contidos e o
dominio das destrezas que contribúan ao desenvolvemento de competencias
profesionais a través da redacción dun proxecto persoal que non só estimule a reflexión
crítica sobre o material estudado, senón que ademais esixa a necesidade de tomar
decisións motivadas, anticipe problemas potenciais e propoña posibles solucións desde
a perspectiva da Lingüística Computacional.
7. DISTRIBUCIÓN DA CARGA ECTS. CRONOGRAMA DO CURSO ACADÉMICO 2019-2020
Tendo en conta o calendario oficial aprobado pola USC, a distribución temporal da
materia ao longo do semestre queda como segue:
7.1. DISTRIBUCIÓN DA CARGA ECTS
TIPO DE SESIÓN HORAS
PRESENCIAIS
HORAS NO
PRESENCIAIS
HORAS TOTAIS
EXPOSITIVAS 12 68 80
SEMINARIO 28 36 64
TIUTORÍAS GRUPO 3 3 6
TOTAL 43 107 150
7.2. CRONOGRAMA DO CURSO ACADÉMICO 2019-2020
TEMAS TEMA 1 TEMA 2 TEMA 3 TEMA 4
PERIODO xan/febr febr/marzo marzo/abril abril/maio
25
SESIÓNS
EXPOSITIVAS 2 x 60’ 4 x 60’ 4 x 60’ 3 x 60’
SESIÓNS
SEMINARIO 2 x 120’ 5 x 120’ 4 x 120’ 3 x 120’
TITORÍAS
PROGRAMADAS 1 x 90’ --- --- 1 x 90’
8. AVALIACIÓN
1ª OPORTUNIDADE: Ao comezo do cuadrimestre, o estudante poderá escoller entre
estas dúas opcións de avaliación:
1) Exame final -de toda a materia- que incluirá cuestións teóricas e prácticas
(correspondentes ás sesións expositivas e ás sesións interactivas) e que se
realizará na aula de informática na data establecida pola Secretaría da
Facultade (22/05/2019).
2) Avaliación continuada:
• un 50% da cualificación corresponderá, ademais de á asistencia regular,
ás actividades e exercicios realizados e/ou programados nas sesións expositivas e
interactivas;
• un 50% corresponderá á elaboración e presentación (oral e escrita) dun
proxecto persoal.
Os aspectos, criterios e instrumentos de avaliación aparecen reflectidos a continuación:
ASPECTO
Asistencia, participación e aproveitamento das clases presenciais
CRITERIOS
- Participación activa nas clases
- Calidade científica dos traballos: asimilación de contidos, comprensión dos textos,
análises e interpretacións adecuadas
INSTRUMENTO
- Traballos entregados e/ou expostos nos seminarios e nas titorías programadas
VALOR
- 50%
26
ASPECTO
Conceptos, métodos e ferramentas aprendidos durante todo o curso
CRITERIOS
- Dominio dos coñecementos teóricos e operativos da materia
- Aproveitamento das lecturas
- Calidade científica dos traballos
INSTRUMENTO
- Presentación oral e entrega por escrito dun proxecto persoal.
VALOR
- 50%
2ª OPORTUNIDADE: Efectuarase exclusivamente a través dun exame final que
incluirá cuestións teóricas e prácticas (correspondentes ás sesións expositivas e ás
sesións interactivas). Este exame realizarase na aula de informática na data
establecida pola Secretaría da Facultade (04/07/2019).
ESTUDANTES CON DISPENSA DE ASISTENCIA A CLASE
Os estudantes que teñan concedida polo Decanato a dispensa de asistencia a clase e,
polo tanto, non poidan seguir a avaliación continuada, serán avaliados exclusivamente
a través dun exame final de toda a materia que poderán realizar tanto na primeira coma
na segunda oportunidade. Este exame realizarase na aula de informática nas datas
establecidas pola Secretaría da Facultade para cada unha das oportunidades
(22/05/2019 || 04/07/2019).
27
1. Datos descriptivos de la materia
1.1. DATOS BÁSICOS
CÓDIGO G5041608
NOMBRE DE LA MATERIA LINGÜÍSTICA COMPUTACIONAL
TITULACIÓN
Grado en Filología Clásica
Grado en Lengua y Literatura Españolas
Grado en Lengua y Literatura Gallegas
Grado en Lengua y Literatura Inglesas
Grado en Lenguas y Literaturas Modernas
CARÁCTER
OBLIGATORIA EN MINOR DE LINGÜÍSTICA
OPTATIVA (en los demás casos)
Nº DE CRÉDITOS ECTS 6
LOCALIZACIÓN
FACULTAD DE FILOLOGÍA
(Campus de Santiago)
1.2. REQUISITOS
No se requieren conocimientos previos, más allá de la formación básica adquirida
hasta este momento en las materias de contenido lingüístico cursadas en los diferentes
Grados; la materia está planificada para que pueda ser cursada por cualquier estudiante
de la Facultad. Se recomienda que el estudiantado posea habilidades para la lectura
(con capacidad de síntesis) y comprensión crítica de la información recogida en
diferentes soportes.
También conviene poseer un nivel medio-alto de comprensión escrita de las
lenguas española, gallega e inglesa, ya que los materiales de consulta recomendados así
como los empleados en las sesiones de clase incluyen textos publicados en estos
idiomas.
28
Por otra parte, debe tenerse muy en cuenta que para superar la materia, además
de alcanzar el nivel requerido en cuanto a contenidos y prácticas, será requisito
indispensable mostrar en la realización de las diferentes pruebas –orales y/o escritas–
un nivel de dominio (exposición y argumentación, redacción y ortografía)
acorde con la situación académica del estudiante.
Por último, se recomienda poseer conocimientos de informática a nivel de usuario
y manejo básico de la red Internet.
1.3. PROFESORA ENCARGADA DE LA MATERIA
Profesora: Ana Isabel Codesido García
Área de conocimiento: Lingüística General
Departamento: Lingua e Literatura Españolas, Teoría da Literatura e Lingüística
Xeral
Lengua vehicular de docencia: gallego
1.4. TUTORÍAS: HORARIO, LUGAR E INFORMACIÓN DE CONTACTO
Horario: Fijado al inicio del 2.º semestre
Lugar: despacho 122
Teléfono: 881 811 776
Correo electrónico: [email protected]
2. SENTIDO DE LA MATERIA
Lingüística Computacional forma parte del módulo “Lingüística y procesamiento
de las lenguas. Aplicaciones”. Este módulo se puede cursar como complementario o como
optativo, combinado con cualquiera de los ofertados por otras áreas de la Facultad de
Filología en función de los interéses del alumnado. Para la obtención del “Minor en
Lingüística General” deberá ser combinado con el bloque de materias que constituyen el
módulo “Lenguas y comunicación. Aplicaciones”.
Así pues, y tomando como base los objetivos genéricos del módulo en el que se
integra, la materia Lingüística Computacional introduce a los estudiantes en los
fundamentos de la utilización de ordenadores en el estudio y conocimiento de las
lenguas, destacando la pertinencia de los instrumentos informáticos en el trabajo con
29
bases ingentes de datos lingüísticos reales y su incidencia en el procesamiento
automático de los mismos. El sentido global de esta materia es completar la formación
académica de los estudiantes proporcionándoles conocimientos transdisciplinares
básicos relacionados con los nuevos perfiles profesionales demandados en la sociedad
actual. De este modo, y adoptando una orientación resolutiva, reflexionaremos además
sobre la presencia de las TIC en los terrenos de la comunicación y de las lenguas, bien
en el ámbito propiamente de la Lingüística, bien en el de la Literatura, Teoría literaria,
creación o investigación filológica.
3. OBJETIVOS DE LA MATERIA
La evolución del contexto socioeconómico en los últimos años, prestando atención
preferente a los cambios producidos en el mundo laboral en sus diferentes aspectos y
manifestaciones, junto con las exigencias y necesidads de capacitación profesional que
la sociedad actual pueda demandar de los futuros graduados, fueron referente obligado
a la hora de establecerse los objetivos de la materia Lingüística computacional. Los
muchos y variados perfiles profesionales propuestos en los Grados impartidos en la
Facultad de Filología, así como también las competencias genéricas y específicas que el
alumnado debe poseer para la obtención de su titulación constituyen, por tanto, la base
sobre la que se asientan los objetivos de la materia que a continuación se exponen y que
debieran posibilitar a los estudiantes la adquisición de
conceptos y recursos para:
• Desarrollar destrezas para abordar los diferentes problemas que presenta el
lenguaje natural para su tratamiento computacional en sus diferentes niveles,
atendiendo de modo integrado a las perspectivas lingüística, lógica, matemática
e informática.
• Conocer los diferentes modelos de procesamiento computacional de las lenguas
naturales con el fin de convertirlas en lenguajes automáticos.
• Acercarse a los métodos y herramientas de trabajo empírico de la Lingüística
actual que permitan al estudiante manejar datos lingüísticos reales procedentes
de diversos corpus para su posterior tratamiento informático y computacional.
30
• Conocer los recursos relacionados con el tratamiento computacional del lenguaje
(bases de datos, herramientas de análisis textual, programas de traducción
automática, sistemas de dictado automático, etc.).
• Analizar estos recursos y los resultados obtenidos a partir de su manejo y
aplicación con el fin de poder valorarlos críticamente de acuerdo con los
conocimientos teóricos y metodológicos adquiridos.
4. COMPETENCIAS
Además de las competencias generales propias de los estudios universitarios y
especificadas en los títulos de Grado, los estudiantes de esta materia deberan alcanzar
las siguientes competencias específicas:
4.1.1.Competencias disciplinares cognitivas (saber)
(1) Capacidad de reflexión crítica sobre las relaciones entre las lenguas y las nuevas
tecnologías.
(2) Adquisición de las bases teórico-metodológicas de la Lingüística Computacional.
(3) Conocimiento de las herramientas, aplicaciones y recursos de naturaleza diversa
desarrolladas por y para el estudio computacional de las lenguas.
(4) Comprensión, evaluación y aprovechamiento de estas herramientas y recursos.
4.1.2. Competencias profesionales procedimentales (saber hacer)
(1) Manejo eficaz de los recursos técnicos sobre lenguas y comunicación –incluidos
los accesibles en línea– en particular los orientados a la investigación y a la formación
en ámbitos lingüísticos, literarios, de creación o de investigación filológica.
(2) Capacidad para poner en práctica algunos de los conocimientos adquiridos en
ámbitos como: traducción automática, confección y explotación de corpus lingüísticos, y
reconocimiento y síntesis de habla.
4.1.3. Competencias académicas actitudinales (ser)
(1) Capacidad para poner en relación las distintas disciplinas en las que se sostiene
el estudio computacional de las lenguas.
31
(2) Interés por la diversidad lingüística y cultural y sensibilidad en la valoración de
sus repercusiones en el manejo y diseño de herramientas computacionales para el
estudio de los fenómenos comunicativos.
(3) Capacidad para analizar, valorar y promover las aplicaciones técnicas de
comunicación multimodal en aquellos casos de trastornos comunicativos derivados de
lesiones motoras y/o sensoriales.
(4) Desarrollo de una actitud crítica ante el manejo y la gestión de las TIC y de
Internet en los ámbitos académico, investigador y profesional.
5. CONTENIDOS DE LA MATERIA
5.1. TEMARIO
TEMA 1. Lingüística Computacional: evolución historiográfica y principales líneas de
investigación.
TEMA 2. Utilidades informáticas en Lingüística y desarrollos de la Lingüística de
Corpus como metodología de base empírica.
TEMA 3. Procesamiento del lenguaje natural y Traducción automática.
TEMA 4. Tratamiento de la lengua –hablada y escrita– y desarrollo de productos
comerciales: lingüística y tecnología.
5.2. BIBLIOGRAFÍA
5.2.1. RECURSOS GENERALES: DICCIONARIOS, PANORÁMICAS Y ENCICLOPEDIAS DE
LINGÜÍSTICA COMPUTACIONAL
AGUADO, G. (1993), Diccionario comentado de terminología informática, Madrid:
Paraninfo.
BAKER, P., A. HARDIE & T. MCENERY (2006), A glossary of corpus linguistics, Edinburgh:
E.U.P.
DALE, R., H. MUYSI & H. SOMERS (eds.) (2000), Handbook of Natural Language
Processing, New York/Basilea: Marcel Dekker, Inc.
INDURKHYA, N. & F.J. DAMERAU (eds.) (2010), Handbook of Natural Language
Processing, Boca Ratón, CRC.
LÜDELING, A. & M. KYTÖ (eds.) (2008), Corpus linguistics: an international handbook.
Vol. 1, Berlin/NY: Mouton de Gruyter.
32
LÜDELING, A. & M. KYTÖ (eds.) (2009), Corpus linguistics: an international handbook.
Vol. 2, Berlin/NY: Mouton de Gruyter.
MARCOS MARÍN, F. (1994), Informática y Humanidades, Madrid: Gredos.
MARTÍ, M.ª A. (coord.) (2003), Tecnologías del lenguaje, Barcelona: UOC.
MITKOV, R. (ed.) (2003), The Oxford Handbook of Computational Linguistics, Oxford:
O.U.P.
O'KEEFFE, A. & M. MCCARTHY (eds.) (2010), The Routledge Handbook of Corpus
Linguistics, London: Routledge.
WILSON, R.A. & F. C. KEIL (eds.) (2002), Enciclopedia MIT de ciencias cognitivas,
Madrid: Síntesis.
5.2.2. INTRODUCCIONES A LA LINGÜÍSTICA COMPUTACIONAL
BARNBROOK, G. (1996), Language and Computers. A Practical Introduction to the
Computer Analysis of Language, Edinburgh: E.U.P.
CHIARI, I. (2007), Introduzione alla linguistica computazionale, Roma: Laterza.
GÓMEZ GUINOVART, J. (1998) "Fundamentos de lingüística computacional: bases
teóricas, líneas de investigación y aplicaciones", en P. Cid & J. Baró (eds.) Anuario
SOCADI de Documentación e Información 1998, Barcelona: Societat Catalana de
Documentació i Informació, 135-146.
GÓMEZ GUINOVART, J. & M. PALOMAR (coords.) (1998), Monografía: Lengua y Tecnologías
de la Información. Novática, Revista de la Asociación de Técnicos de Informática,
133 (Mayo-Junio), 3-45.
GÓMEZ GUINOVART, X. (2000), “Lingüística computacional”, en F. Ramallo, G. ReiDoval
& X.P. Rodríguez Yáñez (eds.), Manual de Ciencias da Linguaxe, Vigo: Xerais,
221-286. [http://webs.uvigo.es/sli/arquivos/xerais.pdf]
GOMEZ GUINOVART, X. et al. (eds.) (1999), Panorama de la investigación en lingüística
informática. Monografía de Revista Española de Lingüística Aplicada.
GRISHMAN, R. (1986). Computational Linguistics, Cambridge: C.U.P. [Trad. esp. A.
Moreno Sandoval (1991), Introducción a la lingüística computacional, Madrid:
Visor]
33
HAUSSER, R. (2001 [1999]): Foundations of Computational Linguistics: HumanComputer
Communication in Natural Language, 2ª ed., revisada y ampliada, Berlin:
Springer-Verlag.
KAWAGUCHI, Y. et al. (2005), Linguistic informatics: state of the art and the future,
Amsterdam/Philadelphia: John Benjamins.
LAVID, J. (2005), Lenguaje y nuevas tecnologías: nuevas perspectivas, métodos y
herramientas para el lingüista del siglo XXI, Madrid: Cátedra.
LAWLER, J. & H. ARISTAR DRY (eds.) (1998): Using Computers in Linguistics. A Practical
Guide, London/New York: Routledge.
LLISTERRI, J. (2003), "Lingüística y tecnologías del lenguaje", Lynx. Panorámica de
Estudios Lingüísticos, 2, 9-71
[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_03_Linguistica_Tecnologias
_Lenguaje.pdf]
MARTÍ, M.ª A. & I. CASTELLÓN (2001), La lingüística computacional, Barcelona:
Edicions Universitat de Barcelona.
MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías: el campo de la
lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. USC, 147-227.
[http://liceu.uab.es/~joaquim/publicacions/Llisterri_Moure_96_Linguistica_Com
putacional.pdf]
TOMASI, F. (2009), Metodologie informatiche e discipline umanistiche, Roma: Carocci.
TORDERA, J.C. (2012), El abecé de la Lingüística computacional, Madrid: Arco/Libros.
5.2.3. OTRAS REFERENCIAS DE INTERÉS (AGRUPADAS POR ÁMBITOS)
5.2.3.1. Lingüística de corpus
BARLOW, M. (2001), “Corpus linguistics and theoretical linguistics”, International
Journal of Computational Linguistics, 16:1, 3-44.
KAWAGUCHI, Y. et al. (2007), Corpus-based perspectives in Linguistics,
Amsterdam/Philadelphia, PA: John Benjamins.
LLISTERRI, J. et al. (2005), "Corpus orales para el desarrollo de las tecnologías del habla
en español", Oralia. Análisis del discurso oral, 8, 289-325.
34
MCENERY, T. & A. WILSON (1996, 20012), Corpus Linguistics: an introduction,
Edinburgh:E.U.P. [http://www.lancs.ac.uk/fss/courses/ling/corpus/CONTENTS.HTM]
MCENERY, T. & A. HARDIE (2011). Corpus linguistics: Method, theory and practice.
Cambridge: C.U.P.
MCENERY, T., R. XIAO & Y. TONO (2006): Corpus-Based Language Studies: an advanced
resource book, London/New York: Routledge.
PARODI, G. (2010), Lingüística de Corpus: de la teoría a la empiria, Madrid:
Iberoamericana.
SARDINHA, T. B. (2004), Lingüística de Corpus, Barueri-São Paulo: Manole.
TEUBERT, W. & R. KRISHNAMURTHY (eds.) (2007), Corpus linguistics: critical concepts in
linguistics, London: Routledge.
TORRUELLA, J. (2017), Lingüística de corpus: génesis y bases metodológicas de los
corpus (históricos) para la investigación en Lingüística, Frankfurt am Main:
Peter Lang.
WILSON, A., P. RAYSON & T. MCENERY (eds.) (2003), A rainbow of corpora: corpus
linguistics and the language of the world, München: Lincom.
WYNNE, M. (ed.) (2005), Developing Linguistic Corpora: a Guide to Good Practice,
Oxford: Oxbow Books
[http://www.ahds.ac.uk/creating/guides/linguisticcorpora/index.htm]
5.2.3.2. Procesamiento del lenguaje natural y Traducción automática
COLEMAN, J. (2005), Introducing Speech and Language Processing,
Cambridge/NewYork: C.U.P.
HOCKEY, S. (2001), Electronic texts in the humanities. Principles and practices, Oxford:
O.U.P.
HUTCHINS, W. J. (1986): Machine translation: past, present, future, Chichester, Ellis
Horwood: Ellis Horwood Series in Computers and their Applications.
[http://www.hutchinsweb.me.uk/PPF-TOC.htm]
HUTCHINS, W.J. & H.L. SOMERS (1995), Introducción a la traducción automática,
Madrid: Visor.
35
HUTCHINS, W.J. (2005), Publications on machine translation, computer-based
translation technologies, linguistics and other topics [disponible en
http://www.hutchinsweb.me.uk]
JURAFSKY, D. & J. H. MARTIN (20092), Speech and Language Processing. An Introduction
to Natural Language Processing, Computational Linguistics and Speech
Recognition, Upper Saddle River, NJ: Pearson Prentice Hall.
MARTÍ, M.ª A. & J. LLISTERRI (eds.) (2002), Tratamiento del lenguaje natural: tecnología
de la lengua oral y escrita, Soria/Barcelona: Fundación Duques de Soria/Edicions
Universitat de Barcelona.
MARTÍ, M.ª A. & J. LLISTERRI (eds.) (2004), Tecnologías del texto y del habla, Barcelona:
Edicions Universitat de Barcelona.
MORENO, L. et al. (1999), Introducción al procesamiento del lenguaje natural, Alacant:
Universitat de Alacant.
NIRENBURG, S. (ed.) (1987), Machine Translation. Theoretical and Methodological
Issues, Cambridge: C.U.P.
TORDERA, J.C. (2011), Lingüística computacional. Análisis, generación y traducción
automática (Anexo 20 de Lynx), València: Universitat de València.
TORDERA, J.C. (2011), “Puentes entre la lingüística computacional y la psicolingüística”,
Revista de Lingüística y Lenguas Aplicadas, 6, 341-352.
[https://polipapers.upv.es/index.php/rdlyla/article/view/914/984]
5.2.3.3. Tecnologías lingüísticas
AGUILERA, S. et al. (2001), “Aplicaciones sociales de las tecnologías de la lengua”, Quark.
Ciencia, Medicina, Comunicación y Cultura, 21, 90-94.
[http://www.prbb.org/quark/21/021090.htm]
CAL, M., P. NÚÑEZ & I. PALACIOS (eds.) (2005), Nuevas tecnologías en lingüística,
traducción y enseñanza de lenguas, Santiago de Compostela: Universidade de
Santiago de Compostela, Servizo de Publicacións e Intercambio Científico.
COLE, R. A. et al. (eds.) (1997), Survey of the State of the Art in Human Language
Technology, Cambridge: C.U.P. [http://www.dfki.de/~hansu/HLT-Survey.pdf]
LLISTERRI, J. (2003), "Las tecnologías del habla: Entre la ingeniería y la lingüística", en
Actas del Congreso Internacional ‘La ciencia ante el público. Cultura humanista y
36
desarrollo científico tecnológico’, Salamanca: Instituto Universitario de Estudios
de la Ciencia y la Tecnología, 44-67.
[http://liceu.uab.es/~joaquim/publicacions/Llisterri_03_Tecnologias_Habla_Inge
nieria_Linguistica.pdf]
LLISTERRI, J. (2006), "Introducción a los sistemas de diálogo", en J. Llisterri & M.J.
Machuca (eds.) Los sistemas de diálogo, Bellaterra-Soria: UAB, Servei de
Publicacions - Fundación Duques de Soria (Manuals de la UAB, Lingüística,
45), 11-21.
[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_06_Sistemas_Dialogo.pdf]
MARTÍ, M.ª A. et al. (2004), “Tecnologies de la llengua i las seves aplicacions”, Revista
Gallega de Filología, 5, 107-139.
MARTÍ, M.ª A. & J. LLISTERRI (2001), “La ingeniería lingüística en la sociedad de la
información”, Digithum, 3.
[https://digithum.uoc.edu/articles/abstract/10.7238/d.v0i3.595/]
SIEMENS, R. & S. SCHREIBMAN (eds.) (2007), A companion to digital literary studies,
Malden: Blackwell.
TORDERA, J.C. (2011), Linguistica computacional. Tecnologias del habla. València:
Universitat de València.
VARILE, G. & A. ZAMPOLLI (eds.) (1997), Survey of the State of the Art in Human
Language Technology, Cambridge: C.U.P.
VIDAL BENEYTO, J. (dir.) (1991), Las industrias de la lengua, Madrid: Fundación Sánchez
Ruipérez / Pirámide.
5.3. ESTRUCTURA DETALLADA DEL TEMARIO (SESIONES EXPOSITIVAS, INTERACTIVAS Y
TUTORÍAS)
TEMA 1. Lingüística Computacional: evolución historiográfica y principales
líneas de investigación.
OBJETIVOS: presentar a los estudiantes argumentos que justifiquen la necesidad del
diseño y posterior manejo de diversas herramientas informáticas en las
37
investigaciones lingüísticas a partir de la reflexión sobre posibles problemas reales
derivados del uso de las lenguas y que piden solución.
CONTENIDOS
1. Introducción al campo de la Lingüística Computacional
1.1. Lingüística e Informática; Lingüística e Inteligencia artificial.
1.2. La Lingüística Computacional en el seno de la Lingüística aplicada:
caracterización e historiografía
2. El carácter transdisciplinar de la Lingüística Computacional: vertientes
de estudio
2.1. Lingüística informática: herramientas de manipulación y análisis de datos,
diccionarios automáticos, diseño y explotación de corpus lingüísticos.
2.2. Procesamiento del lenguaje natural y traducción automática.
2.3. Tecnologías (del texto y del habla) e Industrias de la lengua.
BIBLIOGRAFÍA BÁSICA
MORENO FERNÁNDEZ, F. (1990), “Lingüística informática e informática lingüística”,
Lingüística Española Actual, 12/1, 5-16.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la
lingüística computacional”, en M. Fernández Pérez (coord.), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de
Santiago de Compostela, 147-227 (aptdos. 1, 3.2.1.1. e 5).
ROJO, G. (2005-2006), “Informática y Lingüística: Las lenguas en la sociedad del
conocimiento”, Boletín de RedIRIS, 74-75.
[http://www.rediris.es/rediris/boletin/74-75/ponencia1.pdf]
BIBLIOGRAFÍA COMPLEMENTARIA
ARES, F. (2008), El robot enamorado. Una historia de la Inteligencia Artificial,
Barcelona: Ariel. [caps. 7 e 11]
MCCARTHY, J. (2007), What is Artificial Intelligence?
[http://www-formal.stanford.edu/jmc/whatisai/]
MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis. [caps. 1 e
2]
38
SINCLAIR, J. (2001), Corpus, Concordance, Collocation, Oxford: O.U.P.
VIDAL, J. & J. BUSQUETS (1996), “Lingüística computacional”, en C. Martín Vide (ed.),
Elementos de Lingüística, Barcelona: Octaedro Universidad, 392-446.
ORGANIZACIÓN DE LAS SESIONES EXPOSITIVAS E INTERACTIVAS
- 3 sesiones expositivas en las que se desarrollarán las siguientes actividades:
• explicación de los contenidos del tema
• discusión de lecturas obligatorias
- 3 sesiones seminario:
• (1.1.) Presentación y organización de la materia: explicación del contenido de
seminarios y tutorías así como también del sistema de evaluación del esfuerzo de
los estudiantes.
• (1.2.) Trabajo de discusión (en pequeño grupo) basado en material diverso sobre
el ámbito de estudio de la Lingüística Computacional: problemas de delimitación
de la disciplina, distintas aproximaciones según vertientes,
cuestiones terminológicas.
• (1.3.) Puesta en común y análisis de diferentes tipos de materiales relacionados
con el campo de la Inteligencia Artificial.
TEMA 2. Utilidades informáticas en Lingüística y desarrollos de la Lingüística
de corpus como metodología de base empírica.
OBJETIVOS: presentar a los estudiantes la utilización instrumental de la informática en
aquellos estudios de corte lingüístico caracterizados por el manejo cuantitativo de los
datos. Se insistirá en considerar el ordenador como herramienta que dinamiza y
economiza el trabajo con grandes bases de datos lingüísticos.
CONTENIDOS
1. Introducción
39
1.1. Ubicación del campo de la Lingüística informática dentro de los estudios en
Lingüística computacional.
1.2. Panorámica de las utilidades informáticas en Lingüística.
2. Transcripción de interacciones comunicativas (el sistema CHILDES)
2.1. Lenguaje adulto (de interés para Pragmática, Análisis del discurso, Dialectología,
Sociolingüística, Enseñanza/Aprendizaje de lenguas, Planificación lingüística).
2.2. Lenguaje infantil (de interés para Psicolingüística evolutiva, Lingüística clínica,
Enseñanza/Aprendizaje de lenguas, Planificación lingüística).
3. Herramientas de manipulación y de análisis de datos
3.1. Índices y frecuencias.
3.2. Concordancias y colocaciones.
4. Desarrollos de la Lingüística de Corpus como metodología de base
empírica:
4.1. Recursos, herramientas y aplicaciones en Lingüística computacional.
4.2. Tipos y utilidad de los corpus.
4.3. Procesos de enriquecimento y extracción de información de un corpus:
segmentación, análisis, tipificación, etiquetado.
5. Lexicografía computacional:
5.1. Bancos de datos lexicográficos.
5.2. Diccionarios electrónicos.
BIBLIOGRAFÍA BÁSICA
MORENO SANDOVAL, A. (1998), Lingüística computacional, Madrid: Síntesis (28-29; 130-
141).
PARODI, G. (2008), “Lingüística de Corpus: una introducción al ámbito”, Revista de
Lingüística Teórica y Aplicada, 46/1, 93-119.
TORRUELLA, J. & J. LLISTERRI (1999), "Diseño de corpus textuales y orales", en J.M.
Blecua et al. (eds.) Filología e informática. Nuevas tecnologías en los estudios
filológicos. Barcelona: UAB / Milenio, 45-77.
[http://liceu.uab.cat/~joaquim/publicacions/Torruella_Llisterri_99.pdf]
40
BIBLIOGRAFÍA COMPLEMENTARIA
ABAITÚA, J. (2002), “Tratamiento de corpora bilingües”, en M.ª A. Martí & J. Llisterri
(eds.) (2002), Tratamiento del lenguaje natural: tecnología de la lengua oral y
escrita, Soria: Fundación Duques de Soria; Barcelona: Edicions Universitat de
Barcelona, 61-90.
ÁGUILA ESCOBAR, G. (2009), Los diccionarios electrónicos del español, Madrid:
Arco/Libros, S.L.
FERNÁNDEZ PÉREZ, M. (2011), Lingüística de corpus y adquisición de la lengua, Madrid:
Arco/Libros.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la
lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de
Santiago de Compostela, 147-227 (esp. 148, 151, 174-177; 151, 174-177; 198202).
PRIETO, S., E. MOSQUEIRA & N. VÁZQUEZ (2009): “Córpora y enseñanza de lenguas: se
buscan colocaciones”, en P. Cantos & A. Sánchez (eds.), A Survey of Corpusbased
Research. Panorama de investigaciones basadas en corpus, AELINCO,
Murcia, 366-373.
[http://www.dicesp.com/app/webroot/files/file/Prieto%20et%20al_2009.pdf]
SINCLAIR, J. (2005), “Corpus and Text: Basic Principles”, en M. Wynne (ed.), Developing
Linguistic Corpora: a Guide to Good Practice, Oxford: Oxbow Books: 1-16.
[http://www.ahds.ac.uk/creating/guides/linguistic-corpora/chapter1.htm]
TEUBERT, W. (2005), “My version of corpus linguistics”, International Journal of Corpus
Linguistics, 10/1, 1-13.
VIDAL BENEYTO, J. (1991), Las industrias de la lengua, Madrid: Fundación Germán
Sánchez Ruipérez-Pirámide (caps. 3, 4, 5 e 8).
VINCZE, O., E. MOSQUEIRA & M. ALONSO (2011), "An online collocation dictionary of
Spanish", en I. Boguslavsky e L. Wanner (eds.), Proceedings of the 5th
International Conference on Meaning-Text Theory (Barcelona), 275-286.
[http://www.dicesp.com/app/webroot/files/file/MTT%202011%20Vincze%20et%20
al_.pdf]
41
ORGANIZACIÓN DE LAS SESIONES EXPOSITIVAS E INTERACTIVAS
- 5 sesiones expositivas en las que se desarrollarán las siguientes actividades:
• explicación de los contenidos del tema
• discusión de lecturas obligatorias
• análisis de supuestos prácticos
- 5 sesiones seminario en las que los estudiantes realizarán con la profesora:
• (2.1.) Revisión y análisis de los diferentes tipos de herramientas informáticas de
análisis textual.
• (2.2.) Trabajo con corpus (I): Actividades destinadas a familiarizar a los
estudiantes con el manejo de los corpus lingüísticos informatizados y reflexionar
sobre su valor y utilidad (teórica y práctica).
• (2.3.) Trabajo con corpus (II): puesta en común y discusión de ejercicios del
seminario 2.2.
• (2.4.) Trabajo con corpus (III): puesta en común y discusión de ejercicios del
seminario 2.3.
• (2.5.) Actividades destinadas a familiarizar a los estudiantes con el manejo de
bancos de datos lexicográficos y diccionarios electrónicos.
TEMA 3. Procesamiento del lenguaje natural y Traducción automática.
OBJETIVOS: introducir a los estudiantes en el tratamiento computacional de las lenguas
naturales a través de la comprensión y comparación de los distintos modelos de
procesamiento que nos permite convertirlas en lenguajes automáticos.
CONTENIDOS
1. Introducción
1.1. El tratamiento computacional de las lenguas: de lo natural a lo automático.
2. La traducción automática
2.1. Historiografía del ámbito de la traducción automática.
2.2. Traducción automática frente a traducción asistida por ordenador.
42
2.3. Clasificación de los sistemas de traducción automática: criterios y tipología.
2.4. La traducción automática en línea.
3. Procesamiento del lenguaje natural (oral y escrito)
3.1. Introducción al procesamiento del lenguaje natural. Los procesos de
reconocimiento y síntesis. Los sistemas de diálogo.
3.2. Procesamiento del lenguaje natural escrito: las tecnologías del texto.
3.3. Procesamiento del lenguaje natural oral: las tecnologías del habla.
3.4. Aplicaciones del procesamiento del lenguaje natural: presente y futuro.
BIBLIOGRAFÍA BÁSICA
ALONSO, J.A. (2003), “La traducción automática”, en M.ª A. Martí (coord.), Tecnologías
del Lenguaje, Barcelona: UOC, 94-129.
PERIÑÁN, C. (2005), “Procesamiento del lenguaje natural: de lingüista a ingeniero del
conocimiento”, en I. K. Brady, M. Navarro & C. Periñán (eds.), Nuevas Tendencias
en Lingüística Aplicada, Murcia: Quaderna, 293-317.
RUIZ, J. C. (2005), “Lenguaje e informática/Lenguaje y ordenadores”, en Á. López & B.
Gallardo (eds.), Conocimiento y lenguaje, València: Universitat, 401-436.
BIBLIOGRAFÍA COMPLEMENTARIA
ABAITUA, J. (1997-2001), “Presente y futuro de la traducción automática”
[http://paginaspersonales.deusto.es/abaitua/konzeptu/ta/ta97.htm]
ADOLPHS, S. (2006), Introducing Electronic Text Analysis. A practical guide for language
and literary studies, London/New York: Routledge.
HUTCHINS, J. (2003), “Machine Translation: General Overview”, en R. Mitkov, (ed.) The
Oxford Handbook of Computational Linguistics. New York/Oxford: O.U.P., 501-
511.
LLISTERRI, J. (2006), "Introducción a los sistemas de diálogo", en J. Llisterri & M.J.
Machuca (eds.), Los sistemas de diálogo, Bellaterra - Soria: UAB, Servei de
Publicacions-Fundación Duques de Soria (Manuals de la UAB, Lingüística, 45),
11-21.
[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_06_Sistemas_Dialogo.pdf]
MORENO, L. & MOLINA, A. (1999): “Preliminares y tendencias en el Procesamiento del
43
Lenguaje Natural”, Inteligencia Artificial, 3/7, 65-76.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías. El campo de la
lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de
Santiago de Compostela, 147-227 (esp. para PLN: §3 (3.1.1., 3.1.2., 3.1.5.; 3.2.2.;
3.2.3.) e para TA: §3 (3.2.1.))
VALLEZ, M. & R. PEDRAZA-JIMÉNEZ (2007), “El Procesamiento del Lenguaje Natural en
la Recuperación de Información Textual y áreas afines”, Hipertext.net, 5
[http://www.hipertext.net]
ORGANIZACIÓN DE LAS SESIONES EXPOSITIVAS E INTERACTIVAS
- 5 sesiones expositivas en las que se desarrollarán las siguientes actividades:
• explicación de los contenidos del tema
• discusión de lecturas obligatorias
• análisis de supuestos prácticos
- 5 sesiones seminario en las que los estudiantes realizarán con la profesora las
siguientes actividades:
• (3.1. e 3.2.) Traducción automática (I): Actividades destinadas a familiarizar a los
estudiantes con los sistemas de TA y reflexionar sobre su valor y utilidad (teórica
y práctica).
• (3.3.) Traducción automática (II): Actividades de aplicación de métodos y
estrategias para valorar las traducciones automáticas en línea.
• (3.4. e 3.5.) Procesamiento del lenguaje natural: puesta en común y análisis de
diferentes tipos de programas de PLN aplicados a diferentes lenguas y
componentes de las mismas.
TEMA 4. Tratamiento de la lengua –hablada y escrita– y desarrollo de
productos comerciales: lingüística y tecnología.
OBJETIVOS: presentar a los estudiantes dos terrenos que se relacionan en la medida en
que uno de ellos, el de las llamadas Tecnologías del habla, se centra en el diseño de
44
procedimientos variados que permiten la comunicación natural entre persoas y
máquinas mediante el habla, en tanto que el otro, el de las Industrias lingüísticas,
engloba una serie de productos y aplicaciones enfocados desde y hacia la vertiente
escrita.
CONTENIDOS
1. Introducción
1.1. Situación del campo de las Tecnologías e Industrias lingüísticas en el seno de
la Lingüística Computacional. Relación de estas dos vertientes con los campos
de la Tecnología de comunicaciones y de la Ingeniería lingüística.
1.2. Panorámica actualizada de las vertientes de aplicación en Tecnologías del
habla e Industrias de la lengua.
2. Tecnologías del habla
2.1. Introducción.
2.2. Aplicaciones: Síntesis del habla, Reconocimiento del habla. Traducción oral
automática, Identificación y/o verificación de la identidad de los
interlocutores.
2.4. Sistemas de diálogo persona-máquina.
3. Industrias de la lengua
3.1. Introducción.
3.2. Aplicaciones: Conversión de texto a habla; dictado automático; recuperación,
búsqueda y extracción de información; producción asistida por ordenador
(PAO) y edición electrónica, y productos multimedia; traducción automática
y asistida; correctores (ortográficos, gramaticales y estilísticos) y
verificadores; tesauros y diccionarios electrónicos; tratamiento multilingüe de
textos; ELAO (Enseñanza de Lenguas Asistida por Ordenador); aplicaciones
de la Ingeniería lingüística a la ayuda a discapacitados (tratamiento de la
escritura, lectura óptica, sistemas alternativos de comunicación), Tecnología
y gestión del multilingüismo.
45
BIBLIOGRAFÍA BÁSICA
LLISTERRI, J. et al. (2003), “El papel de la lingüística en el desarrollo de las tecnologías
del habla”, en M. Casas (dir.) & C. Varo (ed.), VII Jornadas de Lingüística, Cádiz:
Servicio de Publicaciones Universidad de Cádiz, 137-191.
LLISTERRI, J. (2007), "El español y las nuevas tecnologías", en M. Lacorte (ed.)
Lingüística aplicada del español. Madrid: Arco/Libros (Biblioteca Philologica),
483-520.
MOURE, T. & J. LLISTERRI (1996), “Lenguaje y nuevas tecnologías: el campo de la
lingüística computacional”, en M. Fernández Pérez (coord.) (1996), Avances en
Lingüística Aplicada, Santiago: Servicio de Publicacións. Universidade de
Santiago, 147-227. (esp. §§ 1.1.3, 1.1.4, 2, 3.2.5, 4).
BIBLIOGRAFÍA COMPLEMENTARIA
ABRIL, D., C. DELGADO & Á. Vigara (2009), Comunicación Aumentativa y Alternativa. Guía de
referencia, Madrid: CEAPAT
[http://sid.usal.es/idocs/F8/FDO21102/com_aumentativa.pdf].
LLISTERRI, J. et al. (2005), “Corpus orales para el desarrollo de las tecnologías del habla en
español”, Oralia. Análisis del discurso oral, 8, 289-325.
[http://liceu.uab.es/~joaquim/publicacions/Llisterri_Machuca_Mota_Riera_Rios_05_Cor
pus_Orales_Tecnologias_Habla_Espanol.pdf]
LLISTERRI, J. (2009), “Las tecnologías del habla en las lenguas románicas ibéricas”, Studies in
Hispanic and Lusophone Linguistics, 2 (1), 133-180.
[http://liceu.uab.cat/~joaquim/publicacions/Llisterri_09_Tecnologias_Habla_Lenguas_R
omanicas_Ibericas.pdf]
MARTÍ, M.ª A. (2003) (coord.), Tecnologías del Lenguaje, Barcelona: UOC.
MARTÍ, M.ª A. (2009) “Llengües minoritzades i tecnologia lingüística: perspectives de futur”,
Llengua, Societat i Comunicació, 7
[http://revistes.ub.edu/index.php/LSC/issue/view/268]
VIDAL VILLALBA, J. & J. BUSQUETS RIGAT (1996), “Lingüística computacional”, en C.
Martín Vide (ed.) (1996), Elementos de lingüística, Barcelona: Octaedro, 393-446
(esp. §§ 3.1, 4.1, 4.2, 4.3, 4.5, 4.6, 5)
ORGANIZACIÓN DE LAS SESIONES EXPOSITIVAS E INTERACTIVAS
- 3 sesiones expositivas en las que se desarrollarán las siguientes actividades:
46
• explicación de los contenidos del tema
• discusión de lecturas obligatorias
• análisis de supuestos prácticos
- 3 sesiones seminario en las que se llevará a cabo, bajo la supervisión de la profesora,
una actividad individual en la que el estudiante debe escoger una de las posibles
aplicaciones de las tecnologías lingüísticas y, conjugando las búsquedas en Internet
con la revisión de algunas lecturas propuestas, preparar un trabajo que ha de ser
expuesto en el seminario 3.3. (Cfr. Aptdo. 6 de esta Guía).
TUTORÍAS PROGRAMADAS
La profesora desarrollará las siguientes tutorías en grupos reducidos:
TUTORÍA 1 (1.ª quincena de febrero): organización de los grupos, distribución de las
lecturas y orientaciones para la realización de los trabajos relacionados con los temas 2
y 3.
TUTORÍA 2 (2.ª quincena de abril): revisión y orientación de la elaboración de los
trabajos en curso.
6. METODOLOGÍA
En esta materia adoptaremos una metodología de enseñanza presencial que
garantice la interacción entre la profesora y los estudiantes sin que esto suponga
minusvalorar el proceso de aprendizaje autónomo. Así, el curso de Lingüística
Computacional se desarrollará a través de las clases presenciales (3 h. semanales) y del
trabajo personal de los estudiantes en horas no presenciales (estudio del temario a
través de las lecturas obligatorias y preparación de los ejercicios de aplicación).
Las clases presenciales serán de tres tipos:
1. Sesiones expositivas (1 hora), en las que la profesora proporcionará la información
teórica básica de los temas del programa, reforzada con la presentación de diversos
materiales representativos de los conceptos estudiados. Más concretamente,
asignamos a cada tema de esta materia una serie de lecturas obligatorias que
presentan con claridad los contenidos teórico-prácticos sobre el procesamiento
lingüístico y sus aplicaciones informáticas.
47
2. Sesiones seminario (2 horas), dedicadas, por un lado, a la puesta en común y
discusión de las lecturas obligatorias del programa para comprobar la asimilación de
los contenidos y, por otro, a la presentación y evaluación de los ejercicios de aplicación
propuestos.
3. Tutorías programadas (hora y media) en grupos reducidos con el objetivo de
guiar el trabajo autónomo de los estudiantes.
Como complemento de las sesiones expositivas e interactivas, se habilitará un aula
virtual que se utilizará para el depósito de los materiales digitales que los profesores
vayan disponibilizando a lo largo del curso y para difundir cualquier tipo de información.
Los ejercicios de aplicación que los estudiantes elaborarán en las horas no presenciales
responderán a los siguientes tipos:
a) Respuesta a cuestiones breves relacionadas con el contenido de los
temas, que obliguen a enfrentarse con los aspectos de más difícil comprensión para
aclarar las posibles dudas o que sirvan de aplicación práctica de conceptos explicados
en las sesiones expositivas.
b) Revisión crítica de distintas fuentes documentales relacionadas con los
contenidos de la materia.
También elaborarán un trabajo sobre alguna de las aplicaciones existentes en el
terreno de las tecnologías lingüísticas (estudiadas a lo largo de todo el curso y de un
modo más específico en el Tema 4), que habrá de presentarse en las últimas sesiones del
curso. Si bien todos los detalles de este tipo de prueba serán presentados por la profesora
al comienzo del semestre, los estudiantes deberán ser capaces de demostrar la
asimilación de los contenidos y el dominio de las destrezas que contribuyan al desarrollo
de competencias profesionales a través de la redacción de un proyecto personal que no
solo estimule la reflexión crítica sobre el material estudiado, sinó que además exija la
necesidad de tomar decisiones motivadas, anticipe problemas potenciales y proponga
posibles soluciones desde la perspectiva de la Lingüística Computacional.
48
7. DISTRIBUCIÓN DE LA CARGA ECTS. CRONOGRAMA DEL CURSO ACADÉMICO
2019/2020
La distribución temporal de la materia a lo largo del semestre queda como sigue:
7.1. DISTRIBUCIÓN DE LA CARGA ECTS
TIPO DE SESIÓN HORAS
PRESENCIALES
HORAS NO
PRESENCIALES
HORAS TOTALES
EXPOSITIVAS 12 68 80
SEMINARIO 28 36 64
TUTORÍAS GRUPO 3 3 6
TOTAL 43 107 150
7.2. CRONOGRAMA DEL CURSO ACADÉMICO 2019-2020
TEMAS TEMA 1 TEMA 2 TEMA 3 TEMA 4
PERIODO ener/febr febr/marzo marzo/abril abril/mayo
SESIONES 2 x 60’ 4 x 60’
EXPOSITIVAS 4 x 60’ 3 x 60’
SESIONES
SEMINARIO 2 x 120’ 5 x 120’ 4 x 120’ 3 x 120’
TUTORÍAS
PROGRAMADAS
1 x 90’
---
---
1 x 90’
8. EVALUACIÓN
1ª OPORTUNIDAD: Al comienzo del cuatrimestre, el estudiante podrá escoger entre
estas dos opciones de evaluación:
1) Examen final -de toda la materia- que incluirá cuestiones teóricas y prácticas
(correspondientes a las sesiones expositivas y a las sesiones interactivas) y que
49
se realizará en el aula de informática en la fecha establecida por la Secretaría
de la Facultad (22/05/2019).
2) Evaluación continua:
* un 50% de la calificación corresponderá, además de a la asistencia regular,
a las actividades y ejercicios realizados y/o programados en las sesiones
expositivas e interactivas.
* un 50% corresponderá a la elaboración y presentación (oral y escrita) de un
proyecto personal.
Los aspectos, criterios e instrumentos de evaluación aparecen reflejados a continuación:
ASPECTO
Asistencia, participación y aprovechamiento de las clases presenciales
CRITERIOS
-Participación activa en las clases
-Calidad científica de los trabajos: asimilación de contenidos, comprensión de los textos,
análisis e interpretaciones adecuados.
INSTRUMENTO
Trabajos entregados y/o expuestos en los seminarios y en las tutorías programadas
VALOR
50%
ASPECTO
Conceptos, métodos y herramientas aprendidos durante todo el curso
CRITERIOS
-Dominio de los conocimientos teóricos y operativos de la materia
-Aprovechamiento de las lecturas obligatorias
INSTRUMENTO
Presentación oral y entrega por escrito de un proyecto personal
VALOR
50%
50
2ª OPORTUNIDAD: Se efectuará exclusivamente a través de un examen que incluirá
cuestiones teóricas y prácticas (correspondientes a las sesiones expositivas y a las
sesiones interactivas). Este examen se realizará en el aula de informática en la fecha
establecida por la Secretaría de la Facultad (04/07/2019).
ESTUDIANTES CON DISPENSA DE ASISTENCIA A CLASE
Los estudiantes que tengan concedida por el Decanato la dispensa de asistencia a clase
y, por lo tanto, no puedan seguir la evaluación continua, serán evaluados
exclusivamente a través de un examen final que podrán realizar tanto en la primera
como en la segunda oportunidad. Este examen se realizará en el aula de informática en
las fechas establecidas por la Secretaría de la Facultad para cada una de las
oportunidades.