125
GRUPO DE INGENIERÍA LINGÜÍSTICA INSTITUTO DE INGENIERÍA                   PLAN DE DESARROLLO DEL GRUPO DE INGENIERÍA LINGÜÍSTICA 1999 - 2004 GERARDO SIERRA MARTÍNEZ ANTONIO REYES PÉREZ CÉSAR ANTONIO AGUILAR SONIA ELISA MORETT ÁLVAREZ CARLOS FRANCISCO FONSECA ROJAS ITZIA EREDI BACA IBARRA MÉXICO, D. F. NOVIEMBRE 2004

GRUPO DE INGENIERÍA LINGÜÍSTICA INSTITUTO DE INGENIERusers.dsic.upv.es/~areyes/resources/plangil.pdf · 7.1.1 Servicio social ... La ingeniería lingüística, historia ... o bien

Embed Size (px)

Citation preview

GRUPO DE INGENIERÍA LINGÜÍSTICAINSTITUTO DE INGENIERÍA

                  

PLAN DE DESARROLLO DELGRUPO DE INGENIERÍA LINGÜÍSTICA

1999 ­ 2004

GERARDO SIERRA MARTÍNEZANTONIO REYES PÉREZ

CÉSAR ANTONIO AGUILARSONIA ELISA MORETT ÁLVAREZ

CARLOS FRANCISCO FONSECA ROJASITZIA EREDI BACA IBARRA

MÉXICO, D. F. NOVIEMBRE 2004

GRUPO DE INGENIERÍA LINGÜÍSTICA.......................................................................1I...............................................................................................................................................6Ingeniería Lingüística..............................................................................................................61. La ingeniería lingüística, historia, objetivos y relaciones...................................................6

1.1 Introducción..................................................................................................................71.2 Inteligencia Artificial, Procesamiento de Lenguaje Natural y LingüísticaComputacional..................................................................................................................101.3 Ingeniería lingüística: descripción y aplicaciones.......................................................12

2. Investigación.....................................................................................................................132.1 Universidades, Centros de Investigación e Institutos..................................................132.2 Ingeniería lingüística en el mundo..............................................................................132.3 Ingeniería lingüística en México.................................................................................14

2.3.1 UNAM..................................................................................................................142.3.2 IPN.......................................................................................................................152.3.3 INAOE.................................................................................................................16

3. Docencia............................................................................................................................163.1 Docencia en México....................................................................................................16

4. Desarrollos........................................................................................................................165. Eventos y difusión ............................................................................................................17II ...........................................................................................................................................18Grupo de Ingeniería Lingüística GIL....................................................................................181. Inicio.................................................................................................................................18

1.1 Conformación..............................................................................................................181.2  Objetivos....................................................................................................................181.3 Líneas de investigación...............................................................................................18

2. Proyectos...........................................................................................................................191. Corpus en ingeniería......................................................................................................192. Extracción terminológica..............................................................................................193. Extracción conceptual...................................................................................................194. Banco terminológico.....................................................................................................205. Paradigmas semánticos.................................................................................................206. Diccionario prototipo onomasiológico..........................................................................207. Diccionario integral.......................................................................................................208. Diccionario de lingüística..............................................................................................209. Proyecto ILEX...............................................................................................................2010. Diccionario de sexualidad...........................................................................................21

3. Desarrollos .......................................................................................................................213.1 DEBO..........................................................................................................................213.2 Clustering....................................................................................................................213.3 Banco terminológico...................................................................................................213.4 Página WEB................................................................................................................22

4. Publicaciones.....................................................................................................................224.1 Revistas.......................................................................................................................224.2 Libros..........................................................................................................................22

4.3 Conferencias................................................................................................................225. Integrantes.........................................................................................................................236. Estructura organizativa......................................................................................................23

6.1 Jefe de grupo...............................................................................................................246.2 Jefe de proyecto...........................................................................................................246.3 Jefe de área..................................................................................................................256.4 Coordinador de tarea...................................................................................................256.5 Derechos y obligaciones..............................................................................................25

7. Infraestructura...................................................................................................................267.2 Edificio 12...................................................................................................................267.3 Torre de ingeniería......................................................................................................267.4 Dirección postal...........................................................................................................26

8. Cómputo............................................................................................................................278.1 Hardware.....................................................................................................................278.2 Características.............................................................................................................278.3 Software .....................................................................................................................288.4 Sistema operativo y red...............................................................................................28

Plan de desarrollo..................................................................................................................291. Desarrollo futuro ..............................................................................................................29

1.1 Logística......................................................................................................................292. Difusión.............................................................................................................................30

2.1 Publicación de informes..............................................................................................302.2 Ponencias en congresos...............................................................................................302.3 Publicación de artículos..............................................................................................312.4 Conferencias de difusión.............................................................................................31

2.4.1 Facultades e Institutos en la UNAM....................................................................312.4.2 Instituciones de educación superior en el DF.......................................................322.4.3 Conferencias vía satélite.......................................................................................322.4.4 Secundarias y preparatorias..................................................................................32

2.5 Página WEB del GIL...................................................................................................322.6 Difusión en otros medios............................................................................................33

2.6.1 Boletín del Instituto de Ingeniería........................................................................332.6.2 Revistas y periódicos de difusión.........................................................................332.6.3 Radio y televisión.................................................................................................342.6.4 Conferencias a distancia.......................................................................................34

3. Capacitación y formación..................................................................................................343.1 Capacitación personal programada.............................................................................34

3.1.1 Lecturas................................................................................................................353.1.2 Exploración de técnicas y recursos de lingüística computacional.......................353.1.3 Colaboración en actividades del grupo................................................................353.1.4 Participación en proyectos...................................................................................353.1.5 Redacción de informes.........................................................................................363.1.6 Elaboración de tesis..............................................................................................363.1.7 Participación en congresos...................................................................................36

3.1.8 Redacción de artículos.........................................................................................373.2 Seminario interno........................................................................................................373.3 Cursos internos............................................................................................................373.4 Cursos externos...........................................................................................................383.5 Superación personal....................................................................................................38

3.5.1 Intercambio académico........................................................................................383.5.2 Estancias de investigación....................................................................................383.5.3 Continuación de estudios superiores....................................................................38

 3.6 Capacitación encaminada a la docencia.....................................................................394. Docencia............................................................................................................................39

 4.1 Cursos en la UNAM...................................................................................................394.1.1 Cursos conjuntos entre facultades........................................................................394.1.2 Integración de otras facultades a los cursos actuales...........................................394.1.3 Preparación de nuevos cursos..............................................................................404.1.4 Ingeniería lingüística como opción terminal de la licenciatura en Ingeniería enComputación.................................................................................................................40

 4.2 Cursos a otras instituciones........................................................................................404.2.1 Cursos regulares a instituciones del DF...............................................................404.2.2 Cursos intensivos en provincia.............................................................................404.2.3 Cursos a la iniciativa privada...............................................................................414.2.4 Cursos a distancia.................................................................................................41

 4.3 Diplomado..................................................................................................................414.3.1 Diplomado presencial ..........................................................................................414.3.2 Diplomado a distancia..........................................................................................41

5. Relaciones públicas...........................................................................................................42 5.1 Participación activa en congresos..............................................................................42 5.2 Intercambio académico..............................................................................................42 5.3 Participación en proyectos conjuntos de investigación..............................................43 5.4 Asociaciones...............................................................................................................44 5.5 Convenios...................................................................................................................44

6. Obtención de recursos.......................................................................................................45 6.1 Acervo bibliográfico..................................................................................................45

6.1.1 Compra de libros .................................................................................................466.1.2 Búsquedas de páginas WEB.................................................................................46

 6.2 Recursos lingüísticos..................................................................................................466.2.1 Nuevos recursos...................................................................................................46

 6.3 Financiamiento ..........................................................................................................476.3.1 Búsqueda de fuentes de financiamiento...............................................................476.3.2 Presentación de prototipos...................................................................................47

7. Crecimiento del GIL..........................................................................................................48 7.1 Búsqueda de nuevos integrantes................................................................................48

7.1.1 Servicio social......................................................................................................487.1.2 Becarios en proyectos...........................................................................................487.1.3 Tesistas.................................................................................................................49

7.1.4 Intercambio académico: profesores invitados y estudiantes de intercambio.......49 7.2 Mecanismos de promoción.........................................................................................50

7.2.1 Carteles y trípticos................................................................................................507.2.2 Página WEB.........................................................................................................50

 7.3 Estímulos económicos................................................................................................507.3.1 Becas....................................................................................................................517.3.2 Honorarios............................................................................................................51

 7.4 Búsqueda de mecanismos de integración...................................................................517.4.1 Codirección de tesis ............................................................................................51

 7.5 Búsqueda de proyectos patrocinados.........................................................................51 7.6 Red de trabajo del GIL...............................................................................................52

7.6.1 UNAM..................................................................................................................527.6.2 Exterior.................................................................................................................52

 7.7 Infraestructura............................................................................................................537.7.1 Espacio físico.......................................................................................................537.7.2 Equipo de cómputo..............................................................................................53

8. Consolidación de líneas de investigación..........................................................................53 8.1 Líneas existentes........................................................................................................54 8.2 Nuevas líneas de investigación..................................................................................54

8.2.1 Capacitación.........................................................................................................548.2.2 Búsqueda bibliográfica.........................................................................................548.2.3 Colaboración........................................................................................................55

9. Integración del GIL con el exterior...................................................................................559.1 Canalización de los miembros del GIL al mundo laboral...........................................559.2 CENTLIC....................................................................................................................56

APÉNDICE A.......................................................................................................................57 INSTANCIAS EDUCATIVAS Y DE INVESTIGACIÓN.................................................57

Instancias Educativas e Investigación...............................................................................571. América.........................................................................................................................572. Europa...........................................................................................................................653. Asia...............................................................................................................................844. África.............................................................................................................................885. Oceanía..........................................................................................................................88

APÉNDICE B.......................................................................................................................89DOCENCIA..........................................................................................................................89APÉNDICE C.......................................................................................................................90DESARROLLOS..................................................................................................................90APÉNDICE D.......................................................................................................................93ASOCIACIONES.................................................................................................................93APÉNDICE E........................................................................................................................94EVENTOS.............................................................................................................................94APÉNDICE F........................................................................................................................96PROYECTOS.......................................................................................................................96

1. Corpus en ingeniería......................................................................................................96

2. Extracción terminológica..............................................................................................983. Extracción conceptual...................................................................................................994. Banco terminológico...................................................................................................1005. Paradigmas semánticos...............................................................................................1016. Diccionario prototipo onomasiológico........................................................................1027. Diccionario integral.....................................................................................................1038. Diccionario de lingüística............................................................................................1049. Proyecto ILEX.............................................................................................................10610. Diccionario de sexualidad.........................................................................................108

APÉNDICE G.....................................................................................................................110BECARIOS ........................................................................................................................110

Técnicos Académicos......................................................................................................110Becarios en el Nivel Post­Doctoral.................................................................................110Profesores invitados........................................................................................................110Becarios académicos.......................................................................................................111Becarios doctorales.........................................................................................................111Becarios de Maestría.......................................................................................................112Becarios de Licenciatura.................................................................................................113

APÉNDICE H.....................................................................................................................115GIL......................................................................................................................................115APÉNDICE I.......................................................................................................................119DIFUSIÓN..........................................................................................................................119

I

Ingeniería Lingüística

1. La ingeniería lingüística, historia, objetivos y relacionesEn las siguientes páginas se dará una descripción detallada de la disciplina que desde el año2000 se ha desarrollado en la UNAM, y en específico, en el Instituto de Ingeniería, laingeniería lingüística. De la misma forma, se ofrece al lector un panorama lo más amplioposible de este disciplina. 

El trabajo está dividido en tres partes:1. Ingeniería lingüística2. Grupo de Ingeniería Lingüística (GIL)3. Plan de desarrollo del GIL

Los puntos abordados en la primera parte focalizan la integración como disciplina de laingeniería lingüística, así como el crecimiento que ha tenido, en primera instancia, a nivelinternacional,  y   luego,   a  nivel  nacional.  Asimismo  se  hace  mención de   los   centros  deinvestigación en ingeniería lingüística y en las disciplinas que la conforman, además de loscentros empresariales que han desarrollado productos que provienen de la investigación enesta rama.

También   se   señalan   los   medios   de   difusión,   tales   como   revistas,   libros,   congresos,conferencias, etc., que a lo largo del desarrollo de la ingeniería lingüística han pugnado pordivulgar la disciplina que nos ocupa.

En   la   segunda  parte   se   hace   un   recuento   de   la   ingeniería   lingüística   como   disciplinainteractiva   dentro   de   la   Universidad   Nacional   Autónoma   de   México.   La   creación   yconformación de un grupo de profesionales que desarrollan y difunden esta disciplina através de un grupo denominado Grupo de Ingeniería Lingüística (GIL).

De este ente se destacan los objetivos, las líneas de investigación, la estructura organizativa,así como los proyectos en los que ha participado y los desarrollos y materiales que se handesprendido del trabajo del GIL a lo largo de cuatro años.

La tercera y última parte del trabajo hace énfasis en el desarrollo del GIL a futuro. Se hacemención de la infraestructura que a la fecha se ha conseguido y de las bases que sustentaránel desarrollo futuro. 

Asimismo, al final del trabajo se presentan una serie de apéndices que complementan lainformación del cuerpo del trabajo.

1.1 IntroducciónSin duda, uno de los signos que caracteriza nuestro momento histórico actual, es  la enormecantidad de información que se desplaza a  través del  lenguaje. Desde una conversaciónsimple entre dos personas hasta el uso de tecnologías como Internet, la producción, uso ycontrol de dicha información es parte de nuestras actividades cotidianas.

Dicha   explosión   informativa   no   es   más   que   una   extensión   —dueña   de   una   enormecomplejidad,  por   supuesto—   de   la   función  que   tiene   el   lenguaje   como un   medio  decomunicación   e   interacción.  Su   empleo,   ya   sea   por  medio   de   señas   o   de   fórmulas   ysímbolos escritos, nos permite explicar ideas y creencias. Nos ayuda a conversar, negociar,convencer y expresar nuestras necesidades a los demás. A través de él expresamos nuestrossentimientos   y   narramos   nuestras   vicisitudes   diarias.   Es   la   mejor   herramienta   paratransmitir nuestro conocimiento a otras generaciones. A lo largo de nuestra evolución, ellenguaje nos ha permitido alcanzar un nivel de desarrollo tal, que es difícil concebir a un serhumano impedido de cualquier capacidad o mecanismo que le permita dialogar con losdemás. No es gratuito llegar a pensar, según lo han manifestado investigadores como NoamChomsky, Jerome Bruner o Jean Aitchison, que el hombre puede ser definido como unmamífero articulado, es decir, como una criatura capaz de reconocer y organizar sonidos eimágenes como un medio de comunicación.

Esta idea en torno a la importancia que tiene el lenguaje sobre la condición humana no esnueva: Platón ya se plantea en un diálogo llamado Cratilo la posibilidad de que el lenguaje,o bien sea un invento hecho por los hombres para comunicarse entre sí, o bien es un donque los dioses les brindan, similar al que ellos emplean para interactuar entre ellos. 

A partir de este tópico, a lo largo de la historia se puede rastrear una serie de reflexionesprofundas sobre el papel del lenguaje: desde las posturas nominalistas y realistas surgidasen la Edad Media; pasando luego a la elaboración de las primeras gramáticas renacentistasy modernas, las cuales se propusieron normalizar “el buen uso” de las lenguas europeas —como puede verse en los ambiciosos proyectos de intelectuales como Antonio de Nebrija,sólo por citar un caso—; hasta llegar a la fundación de una ciencia dedicada exclusivamentea su estudio, la lingüística, surgida de los aportes hechos por estudiosos del siglo XIX talescomo Humboldt, los hermanos Grimm y Hermann Paul, entre muchos otros, y finalmenteestructurada a  partir  de   la   seminal  obra  póstuma de  Ferdinand de  Saussure,  Cours  deLinguistique Générale.

Desde Saussure, la lingüística ha presentado por lo menos dos “cambios de paradigmas”radicales. El primero, surgido precisamente de las páginas del Cours..., es la concepción dellenguaje como un sistema de signos que siempre presenta dos caras: la lengua, es decir, lafaceta organizada que todos los individuos hablantes de un mismo idioma comparten entresí; y el habla, el rostro único por el cual estos individuos muestran sus rasgos particulares ycaracterísticos  que   los  distinguen  unos   con  otros.  Lejos   de   las   visiones  evolucionistasdominantes a principios del siglo XX, las cuales buscaban dar con “la lengua original”madre de todos los idiomas; o de las aspiraciones normativas de las “gramáticas del buen

uso”, quizá la aportación más valiosa de Saussure a los estudios del lenguaje es haber dadolos   cimientos   más   sólidos   de   su   época   para   el   nacimiento   de   una   ciencia   como   lalingüística.

El segundo, situado entre las décadas de los cincuenta y los sesenta, es el que se conocecomo “la revolución chomskiana”, derivada de las propuestas formuladas por el lingüistanorteamericano   Noam   Chomsky,   las   cuales   pueden   seguirse   a   través   de   dos   obrasfundamentales:  Syntactic Structures  (1957), y  Aspects of the Theory of Syntax  (1965). Enestos   textos,  Chomsky  plantea   la   posibilidad  de  analizar   el   lenguaje   como un   sistemaformalizado el cual se sostiene a partir de tres elementos básicos: 1) un mecanismo mentalespecífico   de   carácter   innato   (la   llamada  competencia   lingüística),   2)   un   conjunto   deunidades simbólicas o caracteres que conforman expresiones (los cuales van desde sonidoshasta   frases   completas),   y   3)   un   sistema   de   reglas   finito   que   determina   y   regula   lascombinaciones de dichos caracteres para producir expresiones más complejas (a lo que sedenomina gramática), dentro de los umbrales de  la llamada competencia lingüística. 

Si   bien   esto,   a   grandes   rasgos,   puede  mantener   cierta   similitud   con   la   propuesta   queSaussure  aportó   en  su  Cours...,   lo   que  Chomsky  y  sus   continuadores  han  legado  a   lalingüística  es  el énfasis  en tratar al  lenguaje con una visión formalizada, paralela a  losmétodos abstractos que emplea un matemático para generar y resolver un teorema. Estenivel de abstracción, hasta la fecha, ha brindado una serie de ideas valiosas sobre la funcióny uso del lenguaje en los seres humanos, e igualmente ha dado paso a lo que quizá sea eltercer   paradigma   dentro   de   las   ciencias   del   lenguaje:   la   comprensión   y   producciónlingüística de sistemas computacionales autónomos.

En   estrecha   relación   con   la   “revolución   chomskiana”,   dentro   de   las   ciencias   formalesempieza a surgir un área de  investigación y desarrollo  tecnológico que crecerá  a pasosagigantados: las llamadas ciencias computacionales, integradas por una serie de campos desaber  tales  como  la  matemáticas,   la  lógica,   las   teorías  de  la   información,   la  psicologíacognitiva y la propia lingüística. Al igual que los estudios sobre el lenguaje, las cienciascomputacionales tienen un origen antiguo. Entre las reflexiones que hace Descartes sobre lacapacidad del hombre de tener conciencia de sí mismo (el famoso cogito, ergo sum), estefilósofo se plantea la posible existencia de entidades vivientes carentes de un raciociniopropio, los llamados autómatas. Tales entes, si bien son incapaces de “pensar” y “actuar”de manera similar al hombre, sí pueden en algún momento “engañarnos” al imitar ciertasfunciones de éste, como por ejemplo caminar o mover un  objeto. 

Algunos años después, Blaise Pascal logra elaborar una máquina capaz de hacer cálculosmatemáticos, basada en un dispositivo de ruedas dentadas que mostraban caracteres del 0 al9, los cuales, al moverse, permitían hacer sumas. Es a partir de estos primeros pasos queempieza a vislumbrarse la posibilidad de crear máquinas inteligentes que puedan realizardeterminadas acciones de manera autónoma.

Si bien estas ideas eran fascinantes para el siglo XVII, no sería sino hasta casi finales delsiglo XIX cuando los británicos Charles Babbage y Augusta Ada Byron desarrollaron unmecanismo  que era  capaz de  ejecutar  cálculos  matemáticos   complejos,   los  cuales   eranrepresentados  en   tarjetas  perforadas  y   almacenados en  una  memoria  que   le   ayudaba aalmacenar datos, así como un sistema de impresión que le permitía presentar los resultados.A pesar de que este proyecto no llegó a concretarse de forma física, los trabajos de Babbagey Byron sentaron las bases de lo que es hoy la computadora moderna.

Tras  varios   intentos,   será   a   partir  de   la  Segunda Guerra Mundial  que   se  comienzan  aproducir   las   primeras   máquinas   de   cálculo   electrónicas,   algunas   de   las   cuales   seríanempleadas   para   descifrar   códigos   numéricos   claves   con   información   secreta.   En   esteperiodo, las teorías y experimentos de investigadores como Alan Turing, John Atanasoff,Clifford   Berry   o   John   von   Neumann   lograron   consolidar   el   diseño   de   las   primerascomputadoras electrónicas, tales como Colossus, UNIVAC o ENIAC. A partir de la décadade los sesenta, con el desarrollo de los circuitos integrados, se logra establecer sistemas dealmacenamiento y administración de datos más pequeños y más rápidos, lo que dará origena la creación de microprocesadores. Posteriormente, desde los setenta hasta nuestros días, eldesarrollo  y  uso de  unidades  de cómputo   tendrá  un crecimiento  acelerado,  tanto  en  eldiseño de elementos físicos (hardware), como también de sistemas lógicos (software).

Dentro de este último rubro, cobra una gran relevancia el hecho de implementar lenguajesde programación,  es decir, los sistemas simbólicos de codificación de instrucciones queayuden a que una computadora pueda realizar una tarea específica. Si bien en un principiola   escritura   de   programas   representó   un   gran   problema   (por   ejemplo,   el   pedir   a   unacomputadora que ordenara alfabéticamente una lista de nombres podría llevar varios días),hoy en día se ha avanzado enormemente en este punto, de modo que ahora se cuentan conparadigmas de   lenguajes  específicos para  ejecutar   funciones  determinadas.  El  grado defineza con el  cual  se diseñan e  implementan estos   lenguajes­máquina,  ha  llevado a  lasciencias de la computación a tomar y aplicar conceptos y procesos que la lingüística empleapara el análisis del lenguaje natural. 

En este sentido, si bien se trata de un punto específico en el diseño y desarrollo en sistemasde cómputo, es claro ver que existe una relación estrecha —de ninguna manera gratuita —entre lingüística y computación: si partimos de la idea de concebir a una computadora (oretomando a Descartes, a un  autómata) como una máquina capaz de realizar operacionescomplejas e interactuar con el hombre, es un requisito indispensable que tal máquina puedacomprender y generar un lenguaje lo más cercano posible al que emplean los humanos paracomunicarse entre sí. Este reto, difícil de suyo, es precisamente el problema del cual partenalgunas  líneas de  investigación,   tanto en cómputo como en  lingüística,   junto  con otrasciencias, las cuales son agrupadas bajo nombres tales como procesamiento o tratamientodel lenguaje natural, lingüística computacional o ingeniería lingüística.

1.2 Inteligencia Artificial, Procesamiento de Lenguaje Natural yLingüística Computacional

El hecho de que una computadora pueda comprender y producir un lenguaje natural, y porconsiguiente   ejecutar   los   procesos   cognitivos   requeridos   para   realizar   esta   tarea—percepción, inferencia, causalidad, entre otros—, es algo que se liga a lo que en cienciascomputacionales se ha denominado como Inteligencia Artificial. La inteligencia artificial,grosso modo,  puede ser definida como el área de investigación computacional que exploray   desarrolla   máquinas   capaces   de   reproducir   una   conducta  inteligente  aplicada   a   laresolución de problemas, de modo que en algún momento pueda convertirse en un agenteautónomo.  Un  ejemplo  de  esto   es  quizá   la   imagen de  una  computadora  como aquellafamosa  Hal   9000  de  Una   Odisea   Espacial   2001:   pensemos   en   una   máquina   con   losrecursos suficientes para mantener un diálogo con un ser humano, dentro de una situaciónespecífica (en el caso de la película, solicitar a dicha máquina un informe de actividades deuna nave en las últimas dos horas). Si bien esto es posible, para desarrollar un sistema querealice esta acción se tendría que en cuenta los siguientes puntos:

A. Elaborar un sistema de reconocimiento de voz, lo suficientemente preciso comopara distinguir un flujo sonoro que tenga similitud con una emisión lingüística.

B. Diseñar un sistema de procesamiento lingüístico que abarque todos los nivelesde descripción y análisis de una lengua, de modo que la máquina sea capaz dereconocer,   interpretar   y   generar   sílabas,   palabras,   oraciones   y   diálogosespecíficos.

C. Implementar una base léxica de conocimientos que le permita asignar a cadapalabra, frase o diálogo un significado específico.

D. Establecer un sistema de inferencia lógica que le ayude a mantener el hilo dedeterminado diálogo, o que le permita distinguir en qué momento se le planteaun tema, y en qué momento se cambia a otro.

E. Desarrollar un sistema de generación de voz, el cual esté estrechamente ligadocon los mecanismos anteriores,  de modo que pueda, si es el caso, hacer unapregunta con una entonación precisa, que sea distinguible de la entonación quese emplea para dar una respuesta.

Estas cuestiones y su resolución no agotan el problema de lograr que una computadorapueda   interactuar   con   una   persona   de   forma   inteligente   y   autónoma.   La   inteligenciaartificial actual se ha diversificado en diversas líneas de investigación enfocadas a aspectospuntuales sobre este proceso de interacción. Sin pretender agotar todas las líneas posiblesde investigación, se mencionan a continuación algunas de las más conocidas:

Visión: enfocada a desarrollar sistemas ópticos capaces de decodificar e interpretarimágenes o espacios propios de un medio específico.Aprendizaje:  el  hacer que una máquina  logre desempeñar una actividad simplecomo tomar un lápiz, implica diseñar sistemas que faciliten su entrenamiento pararealizar   esta   labor.   Tales   sistemas   de   aprendizaje   contemplan   para   su   diseño

modelos cognitivos basados en el modo de organización del pensamiento humano,como las famosas redes neuronales, por citar un solo ejemplo.Sistemas   de   procesamiento   y   extracción   de   información:  para   que   unacomputadora pueda tener conocimiento de un objeto o un hecho, necesita primeroadquirir  datos  sobre esto, para luego procesarlos y posteriormente contar con unainformación que sea útil para adquirir dicho conocimiento. Esto implica desarrollarsistemas  que  puedan ejecutar  estos  procesos de  análisis  e   inferencia de  maneraóptima.Sistemas expertos y de control: la intención en este rubro es generar sistemas quepermitan   a   una   computadora   administrar   de   manera   eficiente   una   determinadaactividad (por ejemplo, controlar un conjunto de soldadoras dentro de una cadena deensamble para automóviles), por lo que se deben codificar una serie de reglas ymecanismos lógicos que le permitan ejecutar dicha tarea.Procesamiento del lenguaje natural: este último rubro se dirige a la elaboración yaplicación de modelos teóricos y herramientas computacionales capaces de analizar,comprender, reproducir y manipular lenguaje humano, es decir, lenguaje natural.

Dentro del campo que abarca el PLN, se ubican por lo menos dos grandes objetivos deanálisis, a veces difíciles de diferenciar del todo:

A. Por una parte, al considerar que una computadora puede ser en potencia una entidadcapaz de generar y comprender lenguaje natural, se puede deducir que para realizaresta labor es necesario pensar en una teoría lo suficientemente fuerte que permitamodelar (esto es, dar una descripción formal adecuada un fenómeno) dicho lenguajede   manera   clara   y   precisa.   Así,   se   puede   plantear   la   existencia   de   una   ramaparticular   del   PLN   dedicada   a   lograr   este   objetivo,   denominada  lingüísticacomputacional (LC). En síntesis, de acuerdo con James Allen (1995), la lingüísticacomputacional   tiene por meta desarrollar una  teoría computacional  del   lenguaje,empleando formulismos tales como algoritmos y estructuras de datos similares a losde una ciencia computacional.

B. Por   otra   parte,   si   bien   es   cierto   que   la   concepción   de   modelos   teóricoscomputacionales que aborden el estudio del lenguaje es importante, no lo es menosel hecho de desarrollar aplicaciones específicas que, basadas en dichos modelos,resuelvan necesidades específicas en un plano de implementación tecnológica. Deesta manera, el PLN requiere de otra rama enfocada precisamente a la evaluación eimplementación de dichos modelos en herramientas computacionales determinadasque ayuden al análisis, generación y comprensión de una lengua. A esta línea detrabajo se le conoce con el nombre de ingeniería lingüística (IL).

Ambas   ramas,   lingüística   computacional   e   ingeniería  lingüística,   son  dos  caras  de  unamisma moneda. No es fácil poner límites entre una y otra, más que nada porque las dostienen   como problema en  común estudiar  el   lenguaje   humano desde   todas   sus   facetas

posibles, con el fin de lograr que una computadora sea capaz de interactuar usando dicholenguaje   con   seres   humanos.   Sin   embargo,   conviene   sobre   todo   por   cuestionesmetodológicas fijar una frontera en los modos y los fines  inmediatos que dichas ramasbuscan:   en   el   caso   de   la   lingüística   computacional,   concebir   y   fundamentar   modelosteóricos razonables que den cuenta computacionalmente de la naturaleza y funcionamientode un idioma; en el caso de la ingeniería lingüística, diseñar, probar e implementar sistemasde cómputo robustos que puedan generar y comprender una lengua de forma lo más similarposible al modo en como lo hacen las personas. 

1.3 Ingeniería lingüística: descripción y aplicacionesRespecto a la IL, su desarrollo ha sido vertiginoso en los últimos años. Haciendo una brevereseña de su historia, se puede observar que el problema que dio origen a esta rama deinvestigación fue el hecho de crear aplicaciones que ayudasen a la traducción de textos deforma inmediata. Tal problema fue abordado inicialmente en Estados Unidos a partir de ladécada de los treinta, en paralelo con el diseño de sistemas de codificación y decodificaciónde claves militares secretas. A lo largo de la Segunda Guerra Mundial, y parte de la GuerraFría, el énfasis que puso el gobierno norteamericano en crear y lograr un funcionamientoeficiente de dichos sistemas de traducción fue sin  duda notable,  prueba de ello  son lasmáquinas elaboradas por Smirnov­Troyanskii en 1933, Weaver y Booth en 1946, así comoel demo fabricado por IBM en 1954, denominado Toy System. 

2. InvestigaciónLa información, datos textuales y orales, modifican de manera sustancial nuestro mundo yla interacción que tenemos con éste. Actualmente, nos encontramos frente a un cambio quepodríamos llamar revolucionario, por su esencia radical,  en el cual las tecnologías de baseinformática  ofrecen   a   las   personas  un   acceso   instantáneo   a   la   información  en   todo   elmundo.  Por   tanto,  en  este  cambio que  se  está  generando,   la   función del   lenguaje  estámodificándose de forma más profunda que nunca y como consecuencia de esto surge lanecesidad de modelar este lenguaje para crear sistemas informáticos que dan la facilidad deexplotarlo.

Así, la ingeniería lingüística se ha convertido en un foco de atención en el contexto de lainformática y las comunicaciones al transformarse en el vínculo de comunicación entre losseres  humanos  y   las  máquinas.  Todo  esto   con el  propósito  de  hacer  más  amigable  lainteracción del hombre con la tecnología.  

En  general,   los  objetivos de  los  proyectos  de  investigación en  ingeniería  lingüística  semueven a través de la evaluación de la relaciones entre las nuevas tecnologías y servicios dela sociedad de la información, y de una manera muy especial, a aquellas que reúnen a  laingeniería   lingüística   en   tres   dimensiones   básicas:   manipular   y   procesar   información,

mejorar   la   comunicación   hombre­máquina  y   superar   los   problemas   que   representan  lainteracción de lenguas en contacto. 

2.1 Universidades, Centros de Investigación e InstitutosEn   la   actualidad   en   México,   hay   diversos   centros   que   han   impulsado   la   ingenieríalingüística, entre estos centros se encuentran el IPN, el INAOE, BUAP,  y la UniversidadNacional   Autónoma   de   México,   en   específico   el   Instituto   de   Ingeniería,   organizandoconferencias, congresos y otras actividades profesionales y académicas para dar a conocer,difundir e impulsar la ingeniería lingüística. En el apartado 2.3 se da una breve descripciónde estos centros a nivel nacional.

2.2 Ingeniería lingüística en el mundoLa enorme necesidad de explotar la información existente en el mundo, principalmente enformato   textual,   hace   de   la   investigación  en   ingeniería   lingüística   un   asunto  de   sumaimportancia en los centros de investigación de varios países. Un claro ejemplo de esto es laUnión   Europea,   en   donde   se   destina   una   buena   parte   de   recursos   económicos   a   lainvestigación en las industrias de la lengua. 

Países como Estados Unidos y Canadá dedican esfuerzos para explotar la riqueza de laslenguas y crear recursos que satisfagan las nuevas y crecientes necesidades que representala era de la información. 

La investigación en ingeniería lingüística no es sólo un asunto en boga, sino una necesidadde   replantearse   modelos   de   lengua   que   logren   interactuar,   a   través   del   uso   de   lascomputadoras, con el hombre. 

2.3 Ingeniería lingüística en MéxicoLas investigaciones en la aplicación de las computadoras a las tareas lingüísticas iniciaronen México en los años setentas, cuando el Dr. Luis Fernando Lara del Colegio de Méxicoaplicó   las   técnicas   estadísticas   para   el   análisis   automático   de   un   corpus   de   españolmexicano, con el fin de desarrollo de un diccionario de las palabras usadas en México.

En la misma institución hay investigadores que dedican sus esfuerzos y estudios a distintasáreas que se relacionan con la ingeniería lingüística; tal es el caso de Raúl Ávila que hatrabajado construyendo un corpus oral para una empresa televisiva; María Pozzi, quien hatrabajado en distintos  proyectos desarrollando y explotando  la disciplina  terminológica;ente otros, 

Además,   diversos   investigadores   trabajan   en   diferentes   instituciones   en   los   temasrelacionados al Procesamiento de Lenguaje Natural –por ejemplo, el Dr. Héctor Jiménez

Salazar de la BUAP, Puebla; el M. en C. Everardo García Menier de la Universidad deJalapa, Ver., entre otros.

Para coordinar los esfuerzos de los grupos mexicanos que trabajan en el Procesamiento deLenguaje  Natural,   se   está   formando  la  Asociación Mexicana para   el  Procesamiento  deLenguaje Natural (AMPLN).

En México existen varios grupos que activamente trabajan en las tecnologías de lenguaje,tanto en los aspectos prácticos como teóricos. Estos grupos ofrecen los estudios de Maestríay Doctorado, así como las oportunidades de colaboración en los proyectos aplicados. Parala difusión de los resultados y los problemas actuales de la investigación, anualmente seorganiza en México un congreso internacional de alto nivel.

A continuación se describen algunos centros a nivel nacional que desarrollan la ingenieríalingüística en distintos niveles.

2.3.1 UNAMEn 1989, se crea el Laboratorio de Sistemas Inteligentes de la UNAM en lo que hoy día esel  CCADET por el  Doctor  Nicolás Kemper. Entre otros productos,  este  Laboratorio halogrado establecer una metodología de trabajo para el desarrollo de Sistemas Expertos yTutores   Inteligentes.   Además,   cuenta   con   las   herramientas   necesarias   de   hardware   ysoftware   para   desarrollarlos.   Los   Sistemas   Inteligentes   representan   una   disciplinatecnológica   que   permite   resolver   de   manera   eficiente   muchos   de   los   problemas   quepresentan diversas áreas. Algunos de estos problemas tienen que ver con el diagnóstico,diseño, control, automatización y planeación presentes en procesos industriales, médicos,financieros,   administrativos,   etcétera.   Por   este   motivo,   el   grupo   que   conforma   esteLaboratorio orienta todo su esfuerzo hacia la investigación relacionada con la aplicación dela Inteligencia Artificial. 

Aproximadamente en  1998, en el IIMAS de la UNAM se formó un grupo de investigaciónen   lingüística   computacional   liderado   por   el   Dr.   Luis   Pineda   Cortés.   El   grupo   haceinvestigación   fuerte   en   los  diálogos  multimodales   (los  que  emplean,   adicionalmente   allenguaje,   también   gestos,   imágenes,   etc.),   así   como   en   los   formalismos   gramaticalesmodernos, como HPSG. También ofrece los estudios de maestría y doctorado. 

Dentro de la misma institución, sólo que bajo el seno del Instituto de Ingeniería se crea enseptiembre de 1999, liderado por el Dr. Gerardo Sierra, el Grupo de Ingeniería Lingüística(GIL),   que representa un grupo de investigación en la que dos áreas, al parecer alejadas,retoman el sentido de unidad e interdependencia para formar un sólo núcleo. Estas áreasson la lingüística y la ingeniería. 

2.3.2 IPNEn   el   1996,   en   el   CIC­IPN   fue   fundado   el   Laboratorio   de   Lenguaje   Natural   yProcesamiento de Texto. 

En  su historia  de  8  años,  el  Laboratorio ha  desarrollado varios proyectos  científicos ytecnológicos y ha publicado en áreas como el análisis sintáctico y semántico, aprendizajeautomático  de   los   recursos  léxicos  y  compilación  de  diccionarios,  minería de   textos  yresolución de anáfora. El Laboratorio ofrece los estudios de maestría y doctorado. Finalmente,   como   una   parte   de   la   infraestructura   de   la   investigación  en   la   lingüísticacomputacional   en   México,   el   Laboratorio   de   Lenguaje   Natural   del   CIC­IPN,   bajo   lacoordinación del Dr. Alexander Gelbukh, anualmente (en febrero de cada año) organiza elCongreso   Internacional   de   Lingüística   Computacional   y   Procesamiento   Inteligente   deTexto. El congreso reúne a los más conocidos especialistas en esta rama de la ciencia paradar a los estudiantes mexicanos una oportunidad de escuchar a los mejores expertos delmundo.  Las  memorias  del  Congreso   se  publican  por   la  casa   editorial  más  prestigiosa,Springer­Verlag de Alemania, en la serie Lecture Notes in Computer Science.

2.3.3 INAOEEn 2002, un grupo muy prometedor –el laboratorio de tecnologías de lenguaje – se formóen  el   INAOE, Puebla.  Está   orientado a   los   proyectos  prácticos.  Entre   sus   intereses   seencuentra la recuperación de información, la minería de textos, el procesamiento de habla.Parte de este grupo forma Manuel Montes,  uno de los primeros doctores en lingüísticacomputacional   formados  en  México,  egresado del  Laboratorio  de  Lenguaje Natural  delCIC­IPN. El grupo también ofrece los estudios de maestría y doctorado.

3. DocenciaUna forma en la  que el GIL ha manifestado su  interés por dar a conocer  la   ingenieríalingüística   en   las   nuevas   generaciones   ha   sido   mediante   la   impartición   de   clases,seminarios, cursos, etc. Este esfuerzo se ha visto reflejado en la integración del personalhumano del grupo, y en el creciente interés de gente por el área.

3.1 Docencia en MéxicoDesde la creación del GIL se ha hecho hincapié en la necesidad de fomentar el interés delos alumnos de distintas áreas en la ingeniería lingüística; la principal forma en que se haestablecido esta comunicación ha sido a través del diálogo y la interacción que se da alinterior   de  los   salones  de clase.  En  este   sentido,  un  punto  de  suma  importancia   en  eldesarrollo del GIL, y por consiguiente, de la ingeniería lingüística, está en la docencia. 

La principal instancia en donde se ha difundido esta área dentro de la UNAM, es el II, através de la facultad de ingeniería y la facultad de filosofía y letras, así como en el CELE ylos   posgrados   en   lingüística   hispánica   y   aplicada   y   el   posgrado   en   ciencias   de   lacomputación.  Fuera de   la  UNAM instituciones  como el  CIC,  el   INAOE,  la  BUAP,   laUDLA, y algunas otras, se han encargado de promover y difundir el área por medio decursos, talleres, conferencias, etc.

En el Apéndice B se detallan los cursos que, de forma directa e indirecta, se relacionan conla ingeniería lingüística y que se los miembros del GIL han impartido en distintas instanciaseducativas. 

4. DesarrollosGran parte de los esfuerzos que se han hecho en la investigación realizada en ingenieríalingüística   ha   dado   bastantes   frutos,   muestra   de   ello   es   la   creciente   demanda  que   losproductos   que   surgen   de   estas   investigaciones   tienen,   sea   en   ámbito   educativo,   deinvestigación, empresarial o de uso doméstico.

Desde   correctores   ortográficos,   pasando   por   interfaces   de   diálogo   entre   hombre   ycomputadora, hasta los sistemas que generan conocimiento a partir de la información, sehan   originado   una   gama   bastante   amplia   de   recursos   y   desarrollos   que   involucran   laingeniería lingüística. En el Apéndice C se muestran algunos de los desarrollos que diversasinstancias educativas y empresas han creado.

5. Eventos y difusión La  difusión  de   los   avances   en   las   investigaciones  o   la  presentación de   resultados   sonprincipios fundamentales para el desarrollo y crecimiento de cualquier área, en este sentido,los eventos para difundir la ingeniería lingüística y los medios impresos que detallan lostrabajos de la gente involucrada en esta área son numerosos y aumentan en importancia conla participación de más gente que desde distintos  ángulos aborda las problemáticas querepresenta la aplicación de la lengua a los sistemas informáticos.

En  el  Apéndice  E  se  da una   lista  de  los   eventos  más   importantes   relacionados con  laingeniería  lingüística,  así   como,   los  eventos próximos que se   llevarán a cabo en  forosnacionales e internacionales.

II 

Grupo de Ingeniería Lingüística GIL

1. InicioEl Grupo de Ingeniería Lingüística (GIL) surge formalmente en el mes de agosto del año1999.   Su   fundador,   el   doctor   Gerardo   Sierra   Martínez   es   invitado   por   la   secretaríaacadémica del Instituto de Ingeniería de la UNAM a reintegrarse al grupo de profesionalesdedicados   a   la   investigación   dentro   de   esta   casa   de   estudios,   con   el   propósito   deimplementar y, posteriormente, desarrollar el área de la ingeniería lingüística.

1.1 ConformaciónLa conformación del área dentro de la UNAM despertó el interés de jóvenes estudiantes dedisciplinas   tanto   científicas   como   de   humanidades   que   empezaron   a   integrarse   comoservidores sociales, becarios, tesistas, etc., a esta nueva área interdisciplinaria. 

En   la   actualidad   el   grupo   humano   de   trabajo   del   GIL   se   conforma   de   un   par   deinvestigadores,  un  técnico académico, estudiantes  de  licenciatura, maestría y doctorado,además de profesores e investigadores invitados.

1.2  ObjetivosEl objetivo principal del cual parte el desarrollo y la plataforma de investigación del grupoes el de implantar el área de ingeniería lingüística en un centro de investigación nacionalpara   darla   a   conocer,   difundirla   y   formar   profesionales   dedicados   al   estudio   de   lasdisciplinas que integran el área de ingeniería lingüística.

1.3 Líneas de investigaciónLas líneas que guían los proyectos de investigación del GIL parten del proyecto central delGIL, que consiste en desarrollar la plataforma computacional y la estructura lingüística paracrear un diccionario onomasiológico. 

De entre las áreas más  explotadas por el GIL se encuentran:• terminología y terminótica• bancos terminológicos• lingüística de corpus• lexicología y lexicografía

• análisis morfológico, sintáctico y semántico.• interfaces hombre – computadora, etc.

2. ProyectosA   continuación   se   describen   algunos   de   los   proyectos   en   los   que   el   GIL   ha   tenidoparticipación. Cabe destacar que sólo  se da una breve descripción de cada proyecto endonde   no   se   profundiza   sobre   los   alcances   de   los   mismos,   ni   sobre   las   líneas   deinvestigación que se han desprendido de cada uno de ellos y  que se han retomado pormiembros del GIL. 

1. Corpus en ingenieríaEn este proyecto se elaborará  un corpus sobre las diferentes áreas de   la  ingeniería, sebuscará abarcar todas sus ramas: eléctrica, electrónica, civil, mecánica, etc. El corpus seráelaborado a  partir  de  una  colección de  textos  especializados en   las  diferentes áreas  deingeniería. Información específica del corpus estará disponible para su consulta, de modoque pueda ser utilizado con fines de investigación para extraer información lingüística en elárea de ingeniería. 

2. Extracción terminológicaElaboración   de   un   diccionario   electrónico   para   la   búsqueda   de   términos   a   partir   delconcepto en el campo de la física a nivel bachillerato: etapa de captura de datos. En esteetapa se diseñará 1) la base de datos terminológica que permita tanto capturar ágilmente lainformación de los diccionarios electrónicos, como vaciar los datos para integrar la base deconocimientos   léxica   del   diccionario   onomasiológico;   2)   se   buscarán   los   términoscorrespondientes mediante una análisis de frecuencias de las palabras en textos de física anivel bachillerato.

3. Extracción conceptualSentar   las  bases   lingüísticas  necesarias para el  desarrollo  de una  herramienta  capaz  deextraer   automáticamente   contextos   definitorios   a   partir   de   la   estructura,   más   o  menosrecurrente,   de   las   definiciones   en   donde   se   localizan   tanto   términos   como   el   marcodefinitorio de éstos. 

4. Banco terminológicoDiseñar un banco terminológico a partir de bases de datos de textos de especialidad. Coneste banco se pretende ofrecer una herramienta disponible a través de la Web sobre distintasáreas terminológicas con el fin de realizar investigación a distintos niveles.

5. Paradigmas semánticosMejorar   y   adaptar   para   el   español   el   algoritmo   de   clustering   para   generar,   de   formaautomática, paradigmas semánticos a partir del alineamiento de definiciones.

6. Diccionario prototipo onomasiológicoElaborar las bases para la búsqueda onomasiológica de términos en las que se contemplatambién la posibilidad de búsquedas semasiológicas.

7. Diccionario integralReunir la investigación desarrollada en los proyectos del GIL, además de aprovechar losrecursos   creados  en  cada   investigación,  para   crear  un  diccionario  potente   que  permitabúsquedas   inteligentes,   a   partir   de   la   integración   de   los   sistemas   onomasiológicos   ysemasiológicos.

8. Diccionario de lingüísticaEl objetivo general del proyecto es la elaboración de un diccionario integral del área delingüística que permita encontrar  tanto los conceptos que se utilizan para  los diferentestérminos   (diccionario semasiológico),  como  los   términos que  existen para describir   losconceptos (diccionario onomasiológico). Este proyecto se trabaja en forma conjunta con elInsitito de Investigaciones Filológicas de la UNAM.

9. Proyecto ILEXEl objetivo general del proyecto es  la construcción de una interfaz confiable, amigable,ergonómica   y   robusta   para   el   manejo   de   información   lexicográfica   con   buscadoresinteligentes   que   le   permitan   al   usuario   múltiples   tipos   de   consulta   (por   hipertextos,semasiológica, onomasiológica, ideológica, etc.), a la vez que contenga valores agregadosque   hagan   atractivo   el   uso   del   diccionario   (juegos   de   palabras,   aprovechamiento   demultimedios, etc.). 

10. Diccionario de sexualidadSe propone la construcción de varios diccionarios dirigidos a diferentes públicos.   Cadaproducto se hará disponible al público en CD y en línea, a través de Internet. El objetivogeneral   que   se   persigue  con   este   producto   es   “promover  una   cultura  de   la   sexualidadapoyada en información amplia y objetiva”.

Además de los proyectos que arriba se señalan, el GIL trabaja en la búsqueda de nuevosproyectos patrocinados a través de los cuales se obtengan recursos de interés y aplicación anivel investigación, docencia, consumo, etc.

3. Desarrollos En esta sección se dará una breve descripción de los sistemas desarrollados por miembrosdel GIL, y que han servido como plataformas de investigación aplicada en los distintosproyectos en los que el GIL ha participado.

3.1 DEBOSe elaboró el diseño general del diccionario y se realizó un sistema prototipo, denominadoDEBO1,   por   sus   siglas   de  Diccionario  Electrónico  de  Búsqueda   Onomasiológica.   Estesistema permite la búsqueda de 33 términos relativos al área de fenómenos destructivos; elproceso se realiza mediante la introducción del concepto en lenguaje natural.

3.2 ClusteringEste   sistema2  permite   generar,   por   medio   del   alineamiento   de   definiciones,   grupos   depalabras que posiblemente puedan funcionar como sinónimos sin que léxicamente lo sean.El sistema corre sobre bases terminológicas de distintas áreas, tanto para inglés como paraespañol y se ejecuta desde cualquier página Web. 

3.3 Banco terminológicoCon este desarrollo3  se ofrecen herramientas de análisis  lingüístico sobre distintas áreasterminológicas, así como la consulta de información especializada en áreas como la física,la lingüística, la sexualidad, etc.

3.4 Página WEBEs el portal4  del GIL para dar a conocer  las  investigaciones y  trabajos que realiza,  losresultados obtenidos, los desarrollos a que tienen acceso personas externas al GIL, así comolas   publicaciones   y   eventos   del   grupo;   además,   a   través   de   este   medio   se   mantieneinformada y actualizada a la comunidad interesada en las diversas áreas de la ingenieríalingüística.

1 Para ejecutar esta aplicación siga la siguiente liga:http://tabasco.torreingenieria.unam.mx/Debo/Diccionario.html2 Para ejecutar esta aplicación siga la siguiente liga:http://tabasco.torreingenieria.unam.mx/scripts/clusters.exe/home3 Para consultar el banco terminológico siga la siguiente liga:http://iling.torreingenieria.unam.mx/diccionarios/4 Para consultar esta página siga la siguiente liga: http://iling.torreingenieria.unam.mx/

4. PublicacionesA continuación se citan algunos de los foros de difusión e investigación que han permitidodifundir los trabajos del GIL tanto a nivel nacional como internacional. 

4.1 Revistas• Lecture Notes in Computer Science.• Computational Linguistics and Intelligent Text Processing.• International Journal of Lexicography.• Terminology.• Journal of Quantitative Linguistics.• Estudios de Lingüística Aplicada.• IITF Journal, Terminology Science & Research.

4.2 Libros• Practical   Applications   in   Language   and   Computers   PALC   2003.  Peter   Lang,

Alemania, 2004.• Proc.   VIII   Simposio   Iberoamericano   de   Terminología   (ISBN   958­33­4022­7).

Iberoamericana de Terminología RITerm, Cartagena, Colombia, 2002.• Computational Linguistics and Intelligent Text Processing.  Colección en Ciencias

de la Computación, Alexander Gelbukh (ed.), Springer, Berlin, 2002• Computational   Linguistics   and   Intelligent   Text   Processing.  Fondo   de   Cultura

Económica, México, 2002.

4.3 Conferencias• V Coloquio de Lingüística en la Escuela Nacional de Antropología e Historia.• 1° Encuentro de Estudiantes de Literatura y Lingüística de la Universidad Nacional

Autónoma de México.• VII Congreso Nacional de Lingüística (AMLA).• Panel   on   Lexical   Markers   of   Common   Grounds.  8th   International   Pragmatics

Conference.• VII Encuentro Internacional de Lingüística en el Noroeste.• The Fourth North American Symposium on Corpus Linguistics.• VIII Simposio Iberoamericano de Terminología.• II Taller Internacional de Procesamiento Computacional del Español y Tecnologías

del Lenguaje.• IX Congreso Internacional EURALEX 2000.• XVIII Congreso Internacional Coling­2000.

5. IntegrantesEl desarrollo y crecimiento del GIL ha traído consigo un  aumento en el número de personalhumano interesado y dedicado al área. Del año 2000 en el que sólo trabajaban en el áreacuatro personas, incluido su fundador, a las más de veinticinco que en la actualidad estánregistradas como parte del GIL, se desprende el auge que ha tenido el área y el interés quedespierta en los estudiantes por incursionar en áreas interdisciplinarias que no encasillan lainvestigación de sus disciplinas,  ya sea humanísticas o  científicas, en    los   tradicionalesderroteros. 

La   interdisciplinariedad   que   la   ingeniería   lingüística   representa   y   los   niveles   deaplicabilidad de  la   investigación que se  desprenden de ésta,  son puntos  importantes  deseñalar como fuente de atención para las nuevas generaciones de jóvenes investigadores delpaís. Toda   la   información   referente   a   antecedentes,   publicaciones,   intereses,   etc.,   del   grupohumano de trabajo del GIL puede consultarse en el Apéndice H e I.

6. Estructura organizativaLa   reorganización   del   GIL   obedece   al   crecimiento   sustantivo   en   el   número   de   losintegrantes del grupo y de las actividades en desarrollo y a futuro, a la vez que es posiblegracias a la maduración e intereses personales de los participantes. Se toman como base lospuntos señalados en el apartado 1.2, con lo que se cumplen los objetivos fundamentales delGIL:   formar   investigadores   y   realizar   investigación   básica   y   aplicada   en   el   área   deingeniería lingüística.

La estructura está   encabezada por  el  denominado “jefe  del  GIL”,  quien es   responsablegeneral de la coordinación del grupo,  lo   representa y busca el desarrollo y crecimientointegral del grupo. Las actividades del GIL se centran en dos rubros generales: desarrollodel GIL y desarrollo de proyectos. Para el desarrollo del GIL, el jefe del GIL se apoya enlos “coordinadores de tareas”, quienes son los responsables por el cumplimiento de lasactividades de apoyo a las funciones del GIL. En cuanto a los proyectos de investigación,estos   son   coordinados   por   los   “jefes   de   proyecto”,   quienes   son   responsables   ante   elpatrocinador, administran el presupuesto y coordinan el proyecto. 

Para lograr el desarrollo de los diferentes proyectos bajo la responsabilidad de los jefes deproyecto, se cuenta con el apoyo de los jefes de área, a quienes se les delega la coordinaciónespecífica de parte de los proyectos y se les otorga plena confianza para que desarrollen lasinvestigaciones necesarias de manera responsable y comprometida. A su vez, cada uno delos coordinadores de tarea y jefes de área cumplen con sus responsabilidades a través de lasactividades realizadas por los “estudiantes”, a quienes se encargarán de guiar y por quienesserán responsables del cumplimiento satisfactorio de sus actividades. 

6.1 Jefe de grupoLas tareas del jefe del GIL son:

• ser el responsable general de la dirección del GIL;• definir las estrategias generales;• administrar los recursos obtenidos para el grupo;• ser el coordinador general de los diferentes proyectos;• aprobar a los jefes de proyecto y las propuestas de los proyectos, congruentes con

los objetivos del GIL.

6.2 Jefe de proyectoLas tareas del jefe de proyecto son:

• ser el responsable ante el patrocinador por el proyecto;• definir la propuesta de proyecto de acuerdo con los intereses del GIL, sujeta a la

aprobación del jefe del GIL;• avalar y responsabilizarse de inicio a fin por el desarrollo del proyecto (desde la

propuesta hasta la entrega de los informes y resultados finales);• hacer los ajustes necesarios al desarrollo del proyecto, suprimiendo o definiendo

nuevas actividades;• manejar el presupuesto del proyecto;• tener el crédito meritorio del proyecto en las publicaciones, desarrollos de sistemas

y todos los productos resultantes;• designar, en caso necesario, previo acuerdo con el jefe del GIL, un nuevo jefe de

proyecto sustituto, ya sea de duración temporal o permanente;• coordinar la totalidad del proyecto;• tener la visión general del proyecto; • definir, designar y cambiar a los jefes de área para su(s) proyecto(s);• dar lineamientos a los jefes de área sobre las actividades específicas a realizarse; • intervenir directamente con los estudiantes, en caso necesario, para asesorarlos y

reorientarlos.

6.3 Jefe de áreaEl jefe de área tendrá que: 

• ser responsables de los proyectos específicos a su cargo;• documentarse sobre su trabajo para cumplirlo con el alto nivel esperado para el buen

logro del proyecto;• diseñar, bajo la aprobación y en coordinación del jefe de proyecto, sus estrategias y

designar, a su vez, a los responsables por llevar a cabo las actividades específicas;• reportar periódicamente al jefe de proyecto del avance de sus actividades;• recibir los créditos correspondientes, adjunto al jefe de proyecto;• ser responsables de los estudiantes asignados para la realización de las tareas;

• definir actividades específicas que sean realizables por los estudiantes;• supervisar el trabajo de los estudiantes orientándolos en los problemas que tengan.

6.4 Coordinador de tareaLas tareas del coordinador de tarea son:

• apoyar las funciones del GIL;• actuar   en   nombre   del   grupo   y   representar   al   jefe   del   GIL   en   las   tareas

encomendadas.

6.5 Derechos y obligacionesCada miembro del GIL tiene los siguientes derechos y obligaciones:De los estudiantes:

• realizar   las   actividades   encomendadas   por   un   superior   (jefe   del   GIL,   jefe   deproyecto, coordinador de tarea o jefe de área):

• tener a su cargo un número pequeño de actividades sustanciales que realizarán demanera cotidiana para el bien del GIL o de los proyectos;

• cumplir   con   las   tareas   urgentes   encomendadas   de   corta   duración,   dadas   porcualquier superior;

• reportar a su superior de las actividades encomendadas; y,• obtendrán créditos de su trabajo cotidiano en los sistemas que desarrollen o en las

publicaciones en las que participen.

De los profesores invitados y colaboradores externos• participar en los proyectos conjuntos con el GIL;• tener las mismas funciones y atribuciones que los jefes de proyecto, en el caso de

una estancia  permanente durante el periodo del proyecto; y,• tendrán beneficios económicos por su participación en las actividades del GIL;• tendrán los créditos correspondientes por su participación en los proyectos.

 De todos los integrantes del GIL• realizar las actividades necesarias en beneficio del GIL;• tener a su cargo un número pequeño de actividades sustanciales que realizarán de

manera cotidiana para el bien del GIL o de los proyectos; y,• podrán  utilizar   los   recursos  del  GIL  para   su   labor   en  el  grupo  y   su  desarrollo

profesional, previa autorización del jefe del GIL;• podrán realizar su tesis a partir de los resultados obtenidos de su trabajo en el GIL;• podrán impartir clases;• podrán ser reconocidos por su participación en el GIL;• tendrán   los   créditos   correspondientes   en   la   página   WEB,   publicaciones   y

desarrollos;

• podrán dar la referencia a su trabajo en el GIL por el tiempo que participen.• recibirán remuneración económica cuando se acuerde y existan las posibilidades.

7. InfraestructuraEl espacio físico de trabajo con que cuenta el GIL se encuentra bajo la jurisdicción delInstituto  de   Ingeniería   (II)   de   la   UNAM.  A  continuación   se   enumeran   los   centros   deinvestigación en donde se han desarrollado los trabajos del GIL.

7.2 Edificio 12El primer centro de investigación en donde se empezó a desarrollar la ingeniería lingüísticaestá   ubicado   en   el   Edificio   12   del   II,   Bernardo   Quintana.   El   área   fue   adscrita   a   lacoordinación de sistemas, coordinación a la cual pertenece en la actualidad. 

Este espacio fue utilizado desde el segundo semestre de 1999 hasta la fecha.

7.3 Torre de ingenieríaEn la actualidad el espacio físico en el que labora el grupo humano del GIL se encuentraubicado en el basamento de la Torre de Ingeniería (TI), cubículo 3. El motivo base por elcual se trasladaron las instalaciones del GIL a este edificioa radica en el hecho de organizary participar en proyectos que tengan un patrocinio externo a la UNAM y al CONACYT,convirtiéndose en un grupo que genere recursos humanos, materiales y económicos al II, ala UNAM, y a México.

7.4 Dirección postalLa siguiente es la dirección postal del GIL:

Basamento, Torre de Ingeniería. Cubículo 3.Ciudad Universitaria, Apartado Postal 70­472Coyoacán, México, D.F. Código postal 04510 Teléfono 52 (55) 56 23 35 00 ext 1008 y 1009Fax 52 (55) 56 22 81 37

8. CómputoEl   equipo   de   cómputo   con   que   cuenta   el   GIL   ha   ido   en   constante   crecimiento   yactualización gracias  a   la  participación en  diversos  proyectos  que  generan  los   recursoseconómicos para adquirir los equipos.

A continuación se describen las características más importantes del equipo de cómputo delgrupo.

8.1 HardwareEl número total de equipos del GIL es:

• diez computadoras de escritorio, • dos scanners,• una estación de trabajo

Además de cuatro equipos portátiles, que no son parte del hardware propio del GIL sino demiembros que pertenecen al grupo.

En   meses  próximos  está   pendiente   la   entrega   de   dos   computadoras   de   escritorio,   unaportátil y un scanner. 

8.2 CaracterísticasLas características de cada equipo del GIL se describen en las siguientes tablas:

Procesadores Velocidad DiscosDuros

Mem.RAM

2 procesadores  UltraSPARC­II 250, 300 o 400­MHz 4 de XX Gb

Tabla 1: Características de la estación de trabajo

Procesador Velocidad Cap. Disco 1 Cap. Disco 2 Mem. RAMPentium 3 550 Mhz 10 Gb 20 Gb 256 mbPentium 3 866 Mhz 30 Gb ­­ 512 mbPentium 3 996 Mhz 30 Gb ­­ 384mbPentium 4 2.4 Ghz 40 Gb 40 Gb 256mbPentium 3 996 Mhz 30Gb ­­ 512 MbPentium 4 2.4 Ghz 40 Gb 40 Gb 512 MbPentium 4  2.4 Ghz 40Gb 40 Gb 512 Mb

Tabla 2: Características de las PC's de escritorio del GIL

8.3 Software El software con que cuenta el GIL se describe en la siguiente tabla:

Dirección IP OFFICE ACROBAT MESSENGER JSDK  VISUALBASIC

SECURESHELL

OMNIPAGE

132.248.231.56              

132.248.231.36 XP (2002)vers. 10.5

6.0 6,1 1.4.2 6.0 3,2 ­­­­­­­­­­­­­­­

132.248.231.40 XP (2002)vers. 10.5

6.0 6,1 ­­­­­­­­­­­­­­­

­­­­­­­­­­­­­­­ 3,2 12

132.248.231.38 XP (2002)vers. 10.5

6.0 6,1 1.4.1 ­­­­­­­­­­­­­­­ 3,2 ­­­­­­­­­­­­­­­

132.248.231.37 XP (2002)vers. 10.5

6.0 6,1 1.4.2 6.0 3,2 ­­­­­­­­­­­­­­­

132.248.231.41 XP (2002)vers. 10.5

6.0 6,1 1.4.2 ­­­­­­­­­­­­­­­ 3,2 ­­­­­­­­­­­­­­­

132.248.231.60 XP (2002)vers. 10.5

6.0 6,1 1.4.2 ­­­­­­­­­­­­­­­ 3,2 ­­­­­­­­­­­­­­­

132.248.53.59 XP (2002)vers. 10.5

6.0 6,1 ­­­­­­­­­­­­­­­

­­­­­­­­­­­­­­­ 3,2 ­­­­­­­­­­­­­­­

 132.248.156.167 XP (2002)vers. 10.5

6.0 6,1 ­­­­­­­­­­­­­­­

­­­­­­­­­­­­­­­ 3,2 ­­­­­­­­­­­­­­­

132.248.156.164  XP (2002)vers. 10.5

6.0 6,1 ­­­­­­­­­­­­­­­

­­­­­­­­­­­­­­­ ­­­­­­­­­­­­­­­ ­­­­­­­­­­­­­­­

Tabla 1: Software del GIL

Recursos lingüísticos Recursos computacionalesEuroWordnet NLTK

DRAE PitónDiccionario Clave Perl

Diccionario de María Moliner Edit PlusDiccionario Vox XML Writer

Diccionario Larousse MySQLDiccionario Longman JavaDiccionario Collins PHP

Fonetizador para el español

Tabla 2: Software especializado para el desarrollo de la investigación del GIL

8.4 Sistema operativo y redA continuación  se describe  en   la   tabla  4,   los   sistemas  operativos  de   los  equipos  y  surespectiva IP:

Dirección IP Nombre SistemaOperativo

Version S.O.Secundario

Version

132.248.53.41 ayax.iingen.unam.mx Solaris  8.0 ­­­­­­­­­­­­­­­­­­­­­­­­­­­

­­­­­­­­­­­­­­­­­­­­

Tabla 3: Sistema operativo e IP de estación de trabajo

Dirección IP SistemaOperativo

Version S.O.Secundario

Version

132.248.231.56 Suse      132.248.231.36 Win 2000 5.0 ­­  132.248.231.40 Win XP Pro 5,1 Pendiente Pendiente132.248.231.38 Win XP Pro 5,1 SUSE  9.1132.248.231.37 Win XP Pro 5,1 SUSE  9,1132.248.231.41 Win XP Pro 5,1 SUSE  9,1132.248.231.60 Win XP Pro 5,1 SUSE  9,1

132.248.53.59 Win XP Pro 5,1 SUSE  9,1 132.248.156.167 Windows XP 5,1 SUSE  9.1132.248.156.164  Windows XP 5,1 SUSE  9.1

Tabla 4: Sistemas operativos e IP de PC's.

III

Plan de desarrollo

1. Desarrollo futuro Para lograr el objetivo de crecer es indispensable contar con bases firmes y sólidas quepermitan partir de ellas; si contamos con estas bases es mucho más justificada la proyecciónfutura. En el GIL se ha trabajado arduamente a lo largo de cinco años para crear las basesque nos permitan proyectar un desarrollo sustentado en el trabajo de estos años, que a la veznos hace pensar en proyectos más grandes y en un próspero futuro.

En esta tercera parte señalaremos cómo vislumbramos este desarrollo a futuro, a partir delas bases y  trabajo que a la fecha hemos realizado. Nos enfocamos a  las estrategias dedifusión, captación y crecimiento que se ha planteado el grupo para volverse un ente mássólido   y  más   preparado   en   el  ámbito   de   la   investigación;   y   bosquejamos   los   nuevosproyectos y objetivos que pretendemos realizar en un futuro cercano.  

1.1 LogísticaCon el fin de cumplir de la mejor forma el desarrollo a futuro del GIL, éste tiene, comoparte de su logística, una infraestructura humana y de equipo capaz de realizar las tareascolectivas y específicas que requiere este desarrollo. Entre los principales avances que sehan dado para este desarrollo, está   la reestructuración del grupo que se menciona en elapartado   6   (Estructura   organizativa)   de   la     parte   2.   Cuenta   además   con   un   acervobibliográfico lo suficientemente extenso y especializado para sustentar el desarrollo de lasinvestigaciones,   así   como   el   equipo   de   cómputo   y   los   recursos   lingüísticos   ycomputacionales convenientes para lograr este objetivo.

Además de lo anterior, el GIL cuenta con el recurso más importante que cualquier entenecesita   para   crecer,   un   grupo   humano   de   trabajo   bastante   amplio   y   extendidocomprometido con el grupo y con el área. Sin duda, éste es el mayor recurso del GIL, susmiembros. 

2. DifusiónGran parte del trabajo del GIL desde su conformación ha consistido en difundir el área deingeniería lingüística en espacios universitarios y externos a la UNAM. Este trabajo harepresentado un impulso y motivación para continuar con el trabajo que se desarrolla en elGIL dado que ha habido un eco muy importante, tanto a nivel estudiantes como a nivelentidades, de gente interesada en integrarse y trabajar o participar en el área.

Buena parte de este trabajo se ha realizado a través de medios de difusión escritos, ya sea enrevistas,   boletines,   carteles,   etc.,   y   otra   parte   se   ha   realizado   en   foros   de   discusiónespecializados y no especializados, tales como congresos, seminarios, talleres, etc., tanto anivel nacional como internacional.

En seguida destacamos  las  principales estrategias por   las  cuales el  GIL hace y seguiráhaciendo una labor de difusión de la  investigación básica y aplicada que sus miembrosrealizan.

2.1 Publicación de informesComo parte  de  la  capacitación y  desarrollo  de  todos  los   integrantes del  grupo,  el  GILpromueve la redacción de materiales en donde se reporten los problemas y dificultades,tanto   como   los   avances,   resultados,   bibliografía   y   demás   puntos   que   puedan   parecerimportantes de  cada parte del proyecto. Este trabajo, además de servir como estrategia paraque los integrantes se vean más involucrados en la redacción de sus investigaciones, resultaun material bastante útil para que tanto nuevos como viejos integrantes del GIL, tengan unmaterial básico para empaparse de la investigación que se hace en el grupo.

2.2 Ponencias en congresosDe la misma forma en que es importante tener material de consulta impreso o en formatoelectrónico, es igual de necesario estar presente en foros que discutan las nuevas tendencias,los problemas, los avances y demás, de la investigación que se hace fuera del GIL. En estesentido, todos los miembros del grupo tienen el incentivo de mostrar su trabajo en forosnacionales   e   internacionales;   los   eventos   principales   se   concentran   en   los   congresosespecializados, en donde el GIL ha tenido una fuerte y constante participación, no obstante,no descuidamos la participación en  talleres y  seminarios  que  también han representadovaliosas participaciones para el grupo.

En el futuro tenemos considerado continuar con este tipo de participaciones en distintosforos, incluyendo a la nueva gente que se ha incorporado al grupo y que viene realizandomás investigación.

2.3 Publicación de artículosOtra  estrategia  de  difusión  del   trabajo  del  GIL,  y  por   supuesto,  de   incentivo  para   susmiembros,  es  la publicación en medios especializados, nacionales e  internacionales,  deltrabajo que realizan. A la fecha, es interesante la producción de artículos incluidos en variosmedios arbitrados y especializados, esto demuestra el valor y calidad de la investigaciónque viene desarrollando el GIL.

La   lista   completa   de   congresos,   artículos   y   material   desprendido   de   la   investigaciónrealizada por   los  miembros del  GIL puede consultarse en el   rubro  Publicaciones  de  lasiguiente liga: http://iling.torreingenieria.unam.mx/

2.4 Conferencias de difusiónUn medio más de difusión que el grupo ha explotado es el de la docencia como medio dedifusión e información, así como las conferencias, pláticas y reuniones entre estudiantes einvestigadores.

A continuación se desglosa cómo se ha trabajado en este rubro.

2.4.1 Facultades e Institutos en la UNAMActualmente   el   GIL   imparte   cursos   regulares   a   nivel   licenciatura   en   la   facultad   deingeniería y en la facultad de filosofía y letras, así como cursos a nivel posgrado en losprogramas de posgrado de lingüística y de ciencias de la computación. 

La meta del GIL es poder extender este tipo de cursos a otras entidades dentro de la mismaUNAM y en campus internos y externos a CU. Para lograrlo contamos con una base depersonal que se ha ido capacitando en las distintas ramas de la ingeniería lingüística y queya cuenta con experiencia impartiendo clases bajo este disciplina en la UNAM y fuera deella.

2.4.2 Instituciones de educación superior en el DFHasta   el   momento   el   trabajo   de   difusión   que   se   ha   realizado   ha   llegado   a   algunasinstituciones fuera de la UNAM, tal es el caso de la Escuela Nacional de Antropología eHistoria (ENAH) en donde se imparte la materia de lingüística computacional, y el InstitutoFrancés  de  América  Latina   (IFAL)  en  donde  se  da  una  orientación a   la   disciplina  dematerias   como  semiótica,   además   de   la  Universidad   Iberoamericana,   en  donde   se  hanimpartido cursos de traducción asistida por computadora.

En un futuro se  tiene le  intención de llegar a otras  instituciones de educación superior,como el Tecnológico de Monterrey o la Universidad de la Américas, para ofrecer cursossobre la ingeniería lingüística.

2.4.3 Conferencias vía satéliteEn  el   grupo  nos  hemos  dado  cuenta  de  que   en  un  gran  número  de  ocasiones   resultaimposible estar en lugar en donde se  imparten cursos o conferencias de interés;  hemostenido la experiencia de gente que necesita una introducción, y luego, una capacitación en

ingeniería lingüística, y que por motivos de distancia, y en consecuencia, económicos y detiempo, no pueden trasladarse a los eventos que les son necesarios. 

En este sentido, en el grupo se ha planteado la posibilidad de aprovechar la infraestructuracon que cuenta  la  UNAM para  llevar  a  más   lugares el   trabajo  que  desarrollamos.  Lasconferencias vía satélite son un buen comienzo para esta tarea que pretendemos llevar acabo en un futuro cercano.

2.4.4 Secundarias y preparatoriasOtro medio al que pensamos poner atención para el futuro de la ingeniería lingüística lorepresentan  los   jóvenes.  Tanto   secundarias   como preparatorias   son  un  objetivo   al   cualpretendemos llegar por medio de pláticas sencillas e introductorias a la disciplina. Con esto,pretendemos crear el interés de los jóvenes por involucrarse, a futuro, en la disciplina quedesarrollamos en el instituto de ingeniería. 

2.5 Página WEB del GILEl Internet es quizá hoy en día el medio más rápido y eficaz para comunicarnos y saber quépasa en el mundo y en lo que a nosotros nos interesa. En el GIL este aspecto siempre se hatenido muy presente, muestra de ello es la página del grupo que está en línea en la direcciónhttp://iling.torreingenieria.unam.mx/.

En este sitio los navegantes pueden encontrar información básica y especializada sobre laingeniería lingüística, además del trabajo que se ha desarrollado en el GIL en estos cincoaños de vida. Sin embargo, pretendemos no sólo contar con un sitio interesante que déinformación sobre el GIL y sobre la ingeniería lingüista; en el grupo buscamos crear unportal que sea el medio que represente y contenga la información básica y más recientesobre   la   ingeniería   lingüística   en   México   y   en   el   extranjero,   de   la   misma   forma   queconstituya el medio de consulta idóneo y el foro de discusión más sólido para la comunidadinteresada en la disciplina. También buscamos con este portal, ofrecer nuestros productos einvestigación a las entidades gubernamentales tanto como a la iniciativa privada. 

Actualmente  se   está   trabajando en   este  portal,   el   cual   estará  pronto  en   línea.  Algunospuntos, además de los que se mencionaron más arriba,  que se están puliendo para ofreceruna mejor consulta del portal son: 

DiseñoLook and FillActualizaciónProgramas disponiblesLinks, etc. 

2.6 Difusión en otros mediosAdemás de los ya mencionados, por la naturaleza de nuestro trabajo y las características delpúblico al que pretendemos acceder son medios importantes de difusión los existentes ennuestra universidad. Asimismo, pretendemos ir acercándonos a los medios masivos.

2.6.1 Boletín del Instituto de IngenieríaEl Instituto de Ingeniería cuenta con un boletín interno que nos ha abierto el espacio parapublicar información de diferente tipo, conforme a sus propias secciones. En él existe laposibilidad   de   hacer   invitaciones   a   los   eventos   organizados   por   el   GIL,   así   como  depublicar reseñas una vez efectuados éstos. También tiene secciones que dan cuenta de losalumnos  graduados  y  de   los   profesores   visitantes,   además   se   pueden   enviar   pequeñosartículos sobre los proyectos en los que se trabaja dentro del instituto. 

2.6.2 Revistas y periódicos de difusiónA partir de la experiencia de la publicación sistemática de la invitación a las actividadesrelacionadas con el 2º Seminario de Ingeniería Lingüística, organizado por el GIL; en laGaceta   UNAM,   vemos   que   debemos   acceder   a   más   revistas,   si   no   especializadas   enmaterias afines, sí dirigidas a cierto público potencialmente interesado en las actividadesque se promueven.

Un espacio reciente que surge con el fin de difundir todo lo relacionado con la ingenirríalingüística y sus ramas es la revista (por ahora electrónica) de la Asociación Mexicana deProcesamiento de Lenguaje Natural (AMPLN), de la que el GIL es miembro fundador.

Los casos de promoción en periódicos han sido mínimos, pero son importantes y debenprocurarse.

Por otra parte, hemos encontrado eco en servidores de correo electrónico masivos y deavisos   como   el   de   la   Asociación   Mexicana   de   Lingüística   Aplicada   y   de   la   UNAM,respectivamente.

2.6.3 Radio y televisiónEl radio y la televisión constituyen actualmente los medios masivos de comunicación másextendidos y con un público más heterogéneo, por lo que se considera importante poderacceder a ellos, en primera instancia a  los universitarios.

El propósito de este tipo de difusión es diferente al que se tiene con las presentaciones enlos medios anteriormente mencionados. Su carácter sería informar a la comunidad de losresultados más relevantes del trabajo del grupo de manera concisa, con un lenguaje sencilloy accesible para cualquier persona.   

2.6.4 Conferencias a distanciaHasta el momento no hemos impartido este tipo de conferencias, pero las proyectamos en elfuturo inmediato debido a que existe una demanda de capacitación fuera del grupo que sepodría satisfacer de este modo para economizar recursos. Tal es el caso del reciente vínculocon  el   Instituto  Tecnológico Superior  de  Misantla,  Veracruz, después  de  una  visita  deestudiantes al Instituto de Ingeniería, su instituto nos ha solicitado algunos cursos.   

Consideramos viable esto debido a que la UNAM cuenta con la infraestructura necesariapara  ésta  y   otras   actividades  de  difusión  masiva  de   información   con   la   utilización  derecursos multimedia, como el laboratorio IXTLI.

3. Capacitación y formaciónUn aspecto muy importante para la consolidación de la ingeniería lingüista dentro y fuerade la UNAM es que haya gente capaz de investigar, difundir y trabajar en el área. Paralograrlo,  en el  GIL se  han diseñado una  serie  de estrategias que solventen   la   tarea degenerar material humano capacitado y comprometido con el área. 

3.1 Capacitación personal programadaEste   tipo   de   capacitación   se   realiza   bajo   esquemas   previamente   estructurados   ycalendarizados de manera periódica. El objetivo principal es dar a conocer las actividadesrealizadas por cada uno de los integrantes del grupo con sus compañeros de trabajo, asícomo establecer  lazos  de  cooperación con otros  grupos  de   trabajo  e   incluso  con  otrasinstituciones de investigación.

3.1.1 LecturasSon lecturas recopiladas desde antes de la fundación oficial del GIL, el principal objetivode su difusión es establecer un marco teórico dentro del cual se desarrolla dicho grupo, deesta manera se pretende que cada uno de los integrantes que participan en los diferentesproyectos, tengan al menos una idea general y panorámica del área.

Estas lecturas sirven como material de apoyo escrito para las clases impartidas tanto en laslicenciaturas como en posgrado, y además de cumplir las expectativas antes mencionadas,cada  vez  que  una  persona pretende  integrarse  al  grupo de   trabajo,   se  busca  que  estosmateriales presenten de manera formal el o las áreas que el interesado pretenda conocer mása fondo.  

3.1.2 Exploración de técnicas y recursos de lingüísticacomputacional

El desarrollo de capacitación del GIL se divide en dos: (1) un conjunto amplio de técnicas y(2) de recursos computacionales; dicho conjunto es una fase complementaria entre la teoríay la práctica para la capacitación de los miembros del grupo. De manera tal que si unalectura   provee   un   conjunto   teórico   de   elementos,   las   técnicas   y   recursos   ofrecen   elconocimiento  práctico de  lo  que  espera  un usuario  obtener  de  un sistema  generado eningeniería lingüística.5

3.1.3 Colaboración en actividades del grupoTodos los miembros del GIL tienen la obligación de realizar aportaciones académicas acada uno de los proyectos para los que está trabajando, y además, colaborar en actividadesde difusión, organización y ejecución de dichas actividades.

El objetivo de estas actividades es difundir, ya sea dentro del Instituto de Ingeniería y enotras  dependencias de  la  UNAM, así  como en otros  recintos académicos  los   trabajos einquietudes del grupo, creando con esto, espacios de diálogo, intercambio de ideas y lasosde cooperación entre diferentes grupos de trabajo.

3.1.4 Participación en proyectosLos proyectos en los que está trabajando el GIL  no buscan hacer herramientas de trabajo deíndole computacional para un lingüista, ni tampoco hacer desarrollos de cómputo enfocadosal área de lingüística; por el contrario, se busca una retroalimentación bilateral entre las dosáreas   que   comienza   con   el   desarrollo   académico   propio   enfocado   hacia   dicharetroalimentación, de manera que ambas partes no sólo conozcan los problemas específicosdel otro, si no que además se enfoque hacia la búsqueda de soluciones conjuntas. 

Es por  tal  motivo  que el GIL participa dentro de un área muy amplia de proyectos deinvestigación que buscan dar respuestas y soluciones a las problemáticas que se plantea ladisciplina.

3.1.5 Redacción de informesLa utilización de técnicas eficientes de redacción aplicadas al desarrollo de   informes deactividades   en   materia   científica,   son   de   suma   importancia   para   cualquier   área   deinvestigación. Los cursos de redacción que tanto en el GIL como en el exterior han tomadolos   miembros,   pretenden   lo   anterior,   y   en   casos   más   sencillos   simplemente   se   buscahomogenizar la estructura  general de redacción de un documento.

5 Para una exploración más detallada de las técnicas y de los recursos de la ingeniería lingüística, consultar elsiguiente link: http://iling.torreingenieria.unam.mx/curso/default.htm

Lo anterior es parte  importante para  la formación de los miembros del GIL ya que lespermite ganar experiencia y conocimientos para  realizar los informes que cada uno de ellospresenta a su superior, y posteriormente, para la elaboración de sus tesis.

3.1.6 Elaboración de tesisDe   la   misma   manera   que   debemos   adquirir   la   habilidad   de   redacción   técnica   bienestructurada, es de suma importancia tener conocimientos concisos sobre el desarrollo dedocumentos   informativos  y  explicativos  de  procesos  de   investigación  realizados  en  unproyecto científico, esto con la mira de obtener un grado académico: el caso específico, latesis de grado.

Este   otro   tipo   de   habilidad   nos   servirá   también   para   que   las   tesis   de   los   graduados,pertenecientes   al   grupo,   sirvan   de   base   de   conocimiento   y   consulta   para   que   lasgeneraciones futuras tengan más material de consulta.

El GIL ha realizado cursos especializados en este rubro y en un futuro se llevarán a cabo demanera periódica.

3.1.7 Participación en congresosEl  GIL se desarrolla en  un área de   investigación multidisciplinaria,  por   lo  que  es  unaexigencia el dar a conocer su trabajo y retroalimentarse de otros trabajos. Para ello, cadamiembro del GIL está conciente de que su trabajo tiene un valor muy importante para elgrupo  y merece ser dado a conocer.

El   principal   medio   para   dar   a   conocer   este   trabajo   es   la   presentación   en   congresosnacionales e internacionales. En la actualidad, la gran mayoría de los miembros del grupohan tenido una experiencia en congresos de distinta índole relacionados con las áreas de laingeniería lingüística, por lo cual se pretende seguir con la participación activa en estosforos para enriquecer el trabajo que el grupo realiza.

3.1.8 Redacción de artículosSi bien es cierto que es importante presentar el trabajo de los miembros en congresos, estambién necesario que este   trabajo  tenga eco con  la  publicación del   trabajo en mediosespecializados de difusión.  Con este   trabajo garantizamos que  la   investigación del  GILpueda ser conocida en otros lugares fuera de los foros que permiten los congresos.

3.2 Seminario internoDurante   los   dos   últimos   años,   se   han   realizado   de   manera   anual,   los   Seminarios   deIngeniería Lingüística, cuyo objetivo principal, es (1) mantener una comunicación estrecha

ente los integrantes del grupo, y (2) dar a conocer a personas ajenas al GIL las actividadesrealizadas por el grupo.

El Seminario está dirigido a todo el público interesado en el tema. Con lo anterior se hanestrechado   lazos   de   cooperación   entre   instituciones   de   algunas   partes   de   la   repúblicamexicana y de la misma UNAM.

A la fecha se han realizado dos seminarios por parte del grupo. El  material del primerseminario puede consultarse en la siguiente liga:  http://iling.torreingenieria.unam.mx/. Elsegundo seminario está por concluir con una respuesta mucho mayor de la que se habíaesperado. 

En el futuro está considerado seguir con esta clase de eventos que han redituado buenosfrutos.

3.3 Cursos internosIndependiente de los  cursos de preparación encaminados a  realizar un mejor  trabajo dedifusión, los miembros del GIL tienen el derecho, y al mismo tiempo, la obligación detomar   una   serie   de   cursos   internos   de   preparación;   estos   cursos   pretenden   un   fincomplementario a la formación multidisciplinaria, por ejemplo, del alumno de cómputo seespera que asista a cursos de lingüística básica, sobre todo en aquellos temas sobre loscuales se desarrollan algunos de los proyectos; mientras que del alumno de lingüística, seespera tome los cursos básicos de cómputo para que desarrolle el área de mejor forma y seprepare de manera integral.

3.4 Cursos externosSon actividades académicas a las cuales los miembros del GIL están invitados a participar.Se   trata  de cursos completamente  especializados  y enfocados en   tareas  específicas queperfeccionan por un lado, la formación del interesado, y al mismo tiempo, busca emplearlas técnicas aprendidas en los proyectos en los que esté trabajando. Cabe mencionar quealgunos cursos se han tomado en la modalidad de estancias académicas en universidades deotros países.

3.5 Superación personalEl GIL se interesa porque todos sus integrantes tengan un desarrollo personal en todos lossentidos, se busca que éste sea integral, de manera que  no sólo se tengan las habilidades yel conocimiento teórico para desarrollar  investigación en ingeniería lingüística, sino queademás   se   logre   obtener   un   desarrollo   profesional   integral,   capaz   de   cumplir   con   lasexpectativas a futuro de cada uno.

Existen varias formas en las que el Grupo cumple con lo mencionado, entre las que seencuentran las de los apartados siguientes.

3.5.1 Intercambio académicoEste rubro es una de las ofertas académicas más atractivas que ofrece el GIL, ya que alhacer   posible   que   el   estudiante   tenga   acceso   a   un   conjunto   de   universidades   enprácticamente todo el mundo, se obtiene una ganancia académica amplia; por un lado, elestudiante se nutre de conocimiento cuyo origen encierra otro enfoque, y por otro, el GILno se cierra a seguir una metodología estática, sino por el contrario, lleva ya por definición,una dinámica constante de cambio. 

3.5.2 Estancias de investigaciónOtro rubro igualmente atractivo, se le dedica a las estancias de investigación, mismas que,al   igual   que   en   el   punto   anterior,   se   pueden   realizar   tanto   a   nivel   nacional   comointernacional,   teniendo   como   objetivo  principal,   realizar   una   serie   de   intercambios   enmateria   de   recursos,   técnicas   y   procedimientos   de   investigación,   con   otros   grupos   detrabajo.

3.5.3 Continuación de estudios superioresEl GIL forma parte del II­UNAM, por  lo que sigue puntualmente los  objetivos de esteúltimo, el cual es capacitar ampliamente a sus becarios de manera que puedan seguir susestudios teniendo siempre en cuenta las aptitudes, habilidades y expectativas futuras, por loque   siempre   se   pretende   que   cumplan   de   manera   específica   con   sus   compromisosacadémicos, lo anterior enriquece de amplia manera el trabajo de investigación del Grupo,dado que mientras  más y  mejor  estén preparados  sus  integrantes,  el   futuro del  GIL sevislumbrará excepcionalmente.

En este sentido, el GIL es un medio muy atractivo para que los estudiantes realicen estudiosde posgrado, desde maestría hasta estudios de posdoctorado.

3.6 Capacitación encaminada a la docenciaOtra de las habilidades por las que el GIL se preocupa desarrollar sobre sus integrantes, sonlas  de  docencia,  por  lo  que,  mediante   la  participación de  los  Seminarios  de  IngenieríaLingüística, la participación en forma de exposiciones o el desarrollo de temas específicosen las clases, se busca cumplir con este objetivo.

A continuación se aborda de manera más amplia y de tallada el por qué y cómo es que sepretende realizar actividades encaminadas a este rubro académico.

4. DocenciaLa importancia de explotar este rubro radica en introducir y preparar gente que se intereseen el área y, si se da el caso, pueda integrarse como parte del GIL.

4.1 Cursos en la UNAMDentro de la UNAM se realizan actividades catedráticas tanto en la facultad de Filosofía yLetras, como en la de Ingeniería. Estos cursos son impartidos tanto a nivel  licenciaturacomo en los posgrados de lingüística y de ciencias de la computación.

4.1.1 Cursos conjuntos entre facultadesAl  impartir cátedra sobre materias en las que se requiere  tanto el conocimiento de unadisciplina como de otra, es de esperarse que los alumnos de ambas facultades se integren entrabajos conjuntos para acreditar las materias.

Es por eso que se pretende seguir como hasta ahora con relación a cursos de diferentescarreras y en diferentes facultades, pero que convergen en esta área de investigación.

4.1.2 Integración de otras facultades a los cursos actualesDe   igual   modo   se   pretende   en   un   futuro   integrar   a   algunas   facultades   dentro   de   lasactividades de cátedra del GIL, para difundir más el área y estrechar o en su caso, crear,lazos de cooperación entre facultades. 

4.1.3 Preparación de nuevos cursosConforme se ha avanzado en el desarrollo de conocimiento se tienen actualmente una seriede cursos en los cuales se introduce al alumno a lo que es el área, además de que se leproporciona el material básico y panorámico de ingeniería lingüística. Sin embargo, dada lacreciente   investigación y   los  nuevos   resultados  que   se  generan en  diversos   lugares,  esimprescindible actualizarse. En este sentido, en el GIL se planean nuevos cursos que seanmás específicos y aborden temas particulares de ingeniería lingüística, de esta forma, seasegura al alumno nueva información y desarrollo actualizado dentro del área. 

Un ejemplo de esto se señala en el siguiente apartado.

4.1.4 Ingeniería lingüística como opción terminal de la licenciaturaen Ingeniería en Computación

A diferencia de otras carreras, incluso del mismo ramo, Ingeniería en Computación carecede   una   oferta   de   opciones   de   especialización  para   el   estudiante   terminal   que   necesita

desarrollarse laboralmente; por el contrario, existen una serie de materias de orden optativoque aunque son interesantes, constituyen una gama amplia de diversidad de tópicos, y nofuncionan como módulo sólido. Entre las innovaciones de GIL al plan de estudios de lacarrera   en   ingeniería   en   computación   está   la   de   crear   el   módulo   de   opción   terminalingeniería lingüística. Con esta opción terminal el estudiante se preparará de forma másintensiva para desarrollarse en el área.

4.2 Cursos a otras institucionesEl conjunto de lazos académicos construidos por el GIL ha dado varios frutos, de maneraque la ingeniería lingüística se he extendido hacia otras instituciones, en algunos casos sehan dado cursos, en otros se están dando, y en otros existen enormes posibilidades de darlosen un futuro.

4.2.1 Cursos regulares a instituciones del DFLa ENAH, y el IFAL han recibido una serie de cursos en la modalidad de materias de temasespecíficos y diplomados respectivamente, donde se ha logrado el reconocimiento del GILy de  la  disciplina,  y  por  lo   tanto,   la   incorporación de algunos  miembros del  GIL a  laplantilla laboral de estas instituciones. En un futuro se pretende abrir los cursos hacia unagama amplia de instituciones para crear una red académica de cooperación.

4.2.2 Cursos intensivos en provinciaGracias   a   la   extensa   difusión   de   las   actividades   del   grupo,   se   ha   logrado   llegar   ainstituciones académicas en el interior del país en donde se ha logrado armar una serie decursos especializados para los estudiantes de dichas instituciones, tal es el caso del InstitutoTecnológico Superior de Misantla, en Veracruz, a los cuales se les dará un curso sobre unaplataforma computacional en el área de Procesamiento de Lenguaje Natural: Python y elNLTK.

4.2.3 Cursos a la iniciativa privadaLa iniciativa privada no está fuera de los planes a futuro del GIL por lo que en institucionescomo  Telmex,   se  han   abierto   las   puertas   para   dar   cursos   aplicados  y  puntuales   sobreaplicación y recursos que necesitan para mejorar el desempeño de la empresa o, alcanzarnuevos  mercados.  De estos  cursos,   además  de   representar una   fuente  de   ingresos  parasustentar   las   actividades   de   investigación,   se   requiere   que   sirvan   como   relaciones   decooperación futura,  y si es el caso, como metas laborales.

4.2.4 Cursos a distanciaPuesto que el trabajo que desarrolla el GIL pertenece a un área de investigación en la cualse desarrolla tecnología, pretendemos que esta misma sea aprovechada para realizar cursos

a distancia, con los cuales, una gama amplia de gente interesada en el área pueda accedersin ningún tipo de barrera espacial.

Para realizar lo anterior el GIL se apoya de la infraestructura humana, física y tecnológicacon que cuenta la UNAM para ofrecer cursos a centros que estén alejados de la ciudad deMéxico.

4.3 DiplomadoEl proyecto de un diplomado es esencial para el GIL puesto que se busca una relación coninstituciones y personas interesadas en la ingeniería lingüística. Este proyecto tiene comobases   las   cátedras   que   tanto   a   nivel   licenciatura   como   posgrado   se   han   impartido   endistintos recintos educativos. 

4.3.1 Diplomado presencial El diplomado presencial busca capacitar de forma más concisa y personalizada a todo aquelque esté  interesado en la ingeniería lingüística. La idea es realizar este diplomado comoparte de los sistemas de ecuación continúa que ofrece la UNAM. 

Otro proyecto más  ambicioso que parte del diplomado, es el de sentar las bases humanas yde conocimiento para proponer una maestría en ingeniería lingüística.

4.3.2 Diplomado a distanciaEste rubro entra como parte de las actividades de preparación en materia de educación adistancia, por lo que si la institución o persona que así lo solicite requiere de este tipo deinstrucción, el GIL está en toda la disposición y cuenta con los recursos para cubrir conesos requerimientos.

5. Relaciones públicasParte fundamental de todo ente social  son las relaciones para intercambiar  ideas, lograrfinanciamientos,  vender  productos,   y   sobre   todo,  mejorar   el   desempeño a   nivel   social,cultural y económico de tal ente; en este sentido, el GIL tiene contemplado un compendiode estrategias para difundir el trabajo que realiza, así como para atraer la integración denuevos miembros. En seguida se detallan estas estrategias. 

5.1 Participación activa en congresosA lo largo del desarrollo que ha tenido el GIL como grupo de investigación se ha hechoénfasis en la necesidad de asistir regularmente a congresos para (1) dar a conocer el trabajode investigación que realiza, (2) retroalimentarse de las investigaciones que se realizan enotros puntos del país y del mundo, (3) participar en foros de discusión especializada para

enriquecer los conocimientos de los miembros del grupo, lo cual redunda en beneficio delGIL, (4) captar la atención de gente interesada en el área para generar foros de participaciónconjunta e intercambio.

De entre los congresos nacionales e internacionales a los cuales han asistido los miembrosdel GIL, destacan:

The North American Symposium on Corpus LinguisticsConferencia Internacional CICLingTaller Internacional de Procesamiento Computacional del Español y Tecnologíasdel LenguajeJornadas Iberoamericanas de TerminologíaCongreso Internacional EURALEX Congreso Internacional ColingEntre otros6.

5.2 Intercambio académicoComo se ha mencionado a lo largo de este trabajo, dentro del GIL existe una preocupaciónmuy fuerte por estar actualizados en las ramas afines a la ingeniería lingüística, y de lamisma  forma, actualizar a otras  personas  fuera del  GIL.  Una estrategia  que el  GIL hacontemplado desde su formación es el intercambio académico de estudiantes, profesores einvestigadores   con   el   fin   de   conocer   y   dar   a   conocer   los   trabajos   de   investigación   ydesarrollos, así como la capacitación entre especialistas y gente interesada en el área.

En la actualidad el GIL ha establecido convenios de intercambio académico con distintasinstituciones de educación superior a nivel nacional e internacional. Del mismo modo, haacogido a profesores y estudiantes de posgrado, y ha enviado a un par de miembros delgrupo a universidades extranjeras.

En la siguiente tabla se mencionan algunos de los participantes nacionales y extranjeros quehan gozado de este beneficio.

Nombre País deprocedencia

País dellegada

Categoría

Marie Hayet Inglaterra México Profesor invitadoCarlos Rodríguez Penagos España México Profesor invitado

Joaquim Llisterri España México Profesor invitadoJock McNaught Inglaterra México Profesor invitado

Claudia Vázquez México, Puebla México Estudiante delicenciatura

6 Para consultar la lista completa de los congresos a los que han asistido los miembros del GIL, consultar elApéndice E.

Gabriel Garduño México España Estudiante delicenciatura

Marlene Moreno del Pilar México España Estudiante delicenciatura

Tabla 5: Personas que han estado en intercambio académico

5.3 Participación en proyectos conjuntos de investigaciónLa canalización de esfuerzos en pro de un fin común es una meta que el GIL ha tomado encuenta desde su inicio. Un ejemplo de este esfuerzo es la participación conjunta con otrasinstituciones en proyectos de investigación. Instituciones de la UNAM como el Instituto deInvestigaciones Filológicas,  el  CCADET, el CELE son una muestra de cómo se ha idoconformando una   red de   trabajo  a   través   de   la  participación  en  distintos  proyectos  deinvestigación, como el Diccionario de Lingüística y el Diccionario de Física. 

Fuera de la UNAM ha habido eco en esta estrategia del GIL; el proyecto Geo Varilex setrabaja de forma conjunta con el COLMEX, con lo cual se espera la captación de nuevosrecursos y el intercambio y mejoramiento de ideas.

En un futuro se  tiene considerado abrir  nuevas propuestas de  investigación conjunta,  ysobre todo, continuar con esta línea que ha enriquecido en distintos aspectos a los miembrosdel GIL.

5.4 AsociacionesLa difusión y retroalimentación de ideas es una meta que en el GIL siempre se ha pensado,una de las estrategias que ha explotado para cumplir tal meta es la participación en grupos,redes y asociaciones especializadas en ingeniería lingüística y las ramas que la conforman.

En este momento algunos miembros del GIL están afiliados a asociaciones dedicadas ainvestigar y difundir conocimiento, tal es el caso de:

Red Iberoamericana de Terminología, RITERMAsociación Mexicana de Lingüística Aplicada, AMLAAsociación de Lingüística y Filología de América Latina, ALFAL

Un gran problema que se ha encontrado con este grupo asociaciones es el carácter  tanespecífico que priva en cada una de ellas, no por esto deja de ser interesante y motivador elparticipar en ellas; sin embargo, dado que la ingeniería lingüística es una rama bastanteamplia de disciplinas que se conjuntan para dar forma a ésta, se ha vuelto una necesidad elcontar   con   una   asociación   dedicada   exclusivamente   a   esta   área   y   subáreas   que   laconforman.  A  lo   largo  del   año  2003  y   lo  que  va  del  presente,   se   ha  concretizado unproyecto muy ambicioso entre los distintos grupos dedicados a esta área. 

La Asociación Mexicana para el Procesamiento de Lenguaje Natural (AMPLN) tiene comoprincipal  meta  el  dar  a  conocer  las   investigaciones  que  dentro  de  estas  áreas   se  estánllevando a cabo, así como el de propiciar un foro óptimo de discusión y de representar a lacomunidad mexicana que está  trabajando duramente. Hoy día, este proyecto ya tiene unfruto, la versión electrónica de la revista de la AMPLN está en línea en el siguiente vínculo:http://www.cicling.org/ampln/info.htm.  De  esta   forma,   se   ha   logrado  dar  un  paso  muyimportante para la consolidación y fortalecimiento de esta disciplina en el ámbito nacional.

5.5 ConveniosComo se mencionó en el apartado 5.2, el GIL se ha preocupado por mantener en constanteactualización a todos sus miembros, prueba de ello son los convenios que ha realizado coninstituciones   educativas   y   laborales   tanto   a   nivel   nacional   como   internacional.   LaUniversidad Pompeu Fabra (UPF) en Barcelona y la University of Manchester Institute ofScience and Technology (UMIST) en Inglaterra son algunas de las instituciones que tienenconvenio con el GIL para intercambio académico, estancias de investigación, realización deestudios de posgrado, etc. 

En Francia, gracias a  la participación en el Eleventh EURALEX International Congresscelebrado en Lorient se logró  concretar un convenio de trabajo con la empresa parisinaIDM que está encargada del desarrollo de recursos léxicos para la creación de diccionarios.Del mismo modo, en México se han logrado establecer pautas para convenios e invitacionesa laborar en departamentos gubernamentales, tal es el caso de la Procuraduría General deJusticia del DF y el Tribunal Electoral, que se han interesado vivamente en la investigacióny desarrollo que se desarrollan en el GIL.

Los resultados son alentadores, no obstante, las metas aún no están completas a nuestraentera satisfacción, de forma que en el GIL se trabaja diariamente en la consecución de lasmetas y objetivos que se ha propuesto; las estrategias de relaciones públicas son un paso deentre varios encaminados a cumplir estos fines.

6. Obtención de recursosUna parte vital dentro del GIL es la infraestructura de recursos que ha ido conformando, yno   sólo   aquellos  económicos,   sino   también   los   referentes   al   conocimiento  en  distintosformatos con que a la fecha cuenta. En los apartados siguientes se señalan algunos de losrecursos con que cuenta y las fuentes que a la fecha y a futuro proporcionarán los recursosnecesarios para el crecimiento del GIL.

6.1 Acervo bibliográficoHasta el momento el acervo bibliográfico con que cuenta el GIL es digno de considerar;manuales, memorias, artículos y libros especializados en formato electrónico y en papel son

parte de los recursos que ha ido constituyendo el grupo. En la tabla 2 se señalan algunas delas áreas temáticas en que está organizado el banco bibliográfico del grupo.

Cómputo Lingüística OtrosInteligencia artificial Lingüística computacional Diccionarios

Redes neuronales Procesamiento de voz ManualesRecuperación de información Procesamiento de lenguaje natural

Extracción de información TraducciónRepresentación del conocimiento Lingüística de corpus

Algoritmos LexicografíaEstadística Terminología

Lógica Gramáticas

Tabla 6: Áreas temáticas del acervo bibliográfico del GIL

Estos  recursos son parte vital para la formación de los miembros del GIL y de las nuevasgeneraciones de gente interesada en el área; con este banco de conocimiento la entrada de lagente del GIL a la disciplina está garantizada; sin embargo, aún estamos lejos de contar contoda   la   bibliografía   que   el   área   ha   generado,   por   ello,   este   acervo   está   en   constanteactualización. A continuación se detallan algunas vías por las cuales se actualiza.

6.1.1 Compra de libros Con los fondos destinados de cada proyecto para la compra de material bibliográfico, laUnidad de Servicios de Información (USI) se encarga de adquirir todo aquel material que esde interés para el área, de esta manera, el acervo de libros del grupo se incrementa de formapaulatina.

Otra estrategia para acrecentar nuestro acervo bibliográfico consiste en el fotocopiado dematerial existente en otras bibliotecas dentro y fuera de la UNAM.

6.1.2 Búsquedas de páginas WEBDe la misma forma en que es importante contar con material impreso, en el grupo es igualde importante tener material en formato electrónico, así como documentos e informaciónque puedan ser consultados en la computadora y, dado el caso, en línea.

Todo  este  material   se  concentra  en   los  Favoritos  de   los  miembros;  el  objetivo  que  seplantea   a   corto   plazo   es   la   de   organizar   todo   este  material,   a   semejanza   del  materialimpreso, en un banco de datos que pueda ser consultado por personal interno y externo delGIL, con una estructura que eficiente las consultas, de modo que toda esta información seaen verdad un recurso aprovechable por cualquier persona.

6.2 Recursos lingüísticosOtra fuente de conocimiento con que se cuenta en el grupo son los recursos lingüísticos enformato   electrónico.   Este   material,   así   como   el   bibliográfico,   es   parte   integral   yfundamental de los procesos de investigación a los que se avoca el GIL. 

De entre la gama de recursos lingüísticos con que cuenta el GIL se pueden destacar losdiccionarios electrónicos,  tanto en español como en  inglés,   tesauros, ontologías,  bancosterminológicos, etiquetadores automáticos,  parsers, etc. El objetivo es aumentar esta basede recursos lingüísticos en beneficio de la investigación en ingeniería lingüística y ramasafines. 

6.2.1 Nuevos recursosAunque los recursos que hasta ahora tiene el GIL son importantes, no podemos dejar deseñalar que no son suficientes; el objetivo que a la fecha se tiene consiste en obtener másrecursos   que   permitan   a   los   integrantes   del   grupo   profundizar   y   acelerar   susinvestigaciones, para de este modo, agilizar los proyectos y conseguir nuevos.

Además de actualizar los recursos existentes,  buscamos conseguir y crear recursos talescomo:

Analizadores morfológicosAnalizadores sintácticosDiccionarios electrónicosEtiquetadores morfosintácticosEtiquetadores semánticos y pragmáticosSistemas de representación del conocimiento

6.3 Financiamiento Un punto por demás importante para consolidar el área de ingeniería lingüística en México,y por consiguiente, al GIL, es la búsqueda y obtención de recursos financieros. Hasta elmomento  este  tipo de recursos se  han obtenido de  instituciones  como el  CONACyT ydependencias de la UNAM; sin embargo, los  niveles a los que se pretende llegar no paranúnicamente en este tipo de financiamiento, sino que abarcan los patrocinios de institucionesgubernamentales y de empresas privadas que aporten mayores recursos que permitan unmejor y más rápido desarrollo de investigación, y en consecuencia, de resultados. 

6.3.1 Búsqueda de fuentes de financiamientoLa economía es un recurso esencial para la estabilidad y funcionamiento de cualquier entesocial, en nuestro caso, este es un tema prioritario en primer lugar porque es a partir delfinanciamiento   de   proyectos   como   ha   logrado   continuar   la   labor   de   investigación   ydesarrollo   del   GIL,   y   en   segundo,   porque   con   recursos   económicos   se   promueve   la

captación   de   recursos   humanos   garantizándoles   un   sustento   económico   mientraspermanecen trabajando en el grupo.

Es por estos motivos que en GIL existe una preocupación muy fuerte por captar fuentes definanciamiento diversas que aseguren la continuidad del grupo. Como meta principal sepretende obtener recursos económicos de entidades federativas y de la iniciativa privada,esto, sin dejar de considerar el patrocinio de proyectos CONACyT y UNAM. 

De esta forma, además de conseguir recursos económicos se garantiza la continuidad de lainvestigación y del fortalecimiento de esta disciplina mediante la creación de desarrolloscon un sustento analítico y de investigación.

6.3.2 Presentación de prototiposOtro aspecto importante para la obtención de recursos financieros consiste en presentar a lasdependencias   interesadas,   prototipos   de   desarrollos   que   muestren   las   capacidades   ypotencialidades que tienen los desarrollos y recursos que se han producido en el GIL. Coneste   tipo   de   presentaciones   pretendemos   describir,   ofrecer   y   mejorar   productos   queresuelvan las necesidades de usuarios y de empresas, atrayendo su atención mediante elempleo de sistemas previos que simulen y solucionen las exigencias particulares de cadauno de ellos.  

7. Crecimiento del GILDesde su creación, el GIL ha visto un crecimiento de dimensiones exponenciales. En cincoaños  hemos  pasado  de   cuatro  a  más  de   30   integrantes   (entre   investigadores,  becarios,estudiantes, prestadores de servicio social y colaboradores externos). Más allá de este dato,la consolidación de la ingeniería lingüística como área de investigación dentro de nuestropaís   (consideración   autónoma   en   publicaciones,   congresos   y   seminarios,   demanda   dedocentes especializados) obedece en gran medida al trabajo sistemático del grupo; al mismotiempo,   para   satisfacer   la   demanda   creciente   de   aplicaciones   desarrolladas   desde   laingeniería lingüística, se requiere de una planta de profesionales capacitados en este campo.

7.1 Búsqueda de nuevos integrantesPor los motivos arriba expuestos, es importante mantener una política de apertura hacia losjóvenes con estudios afines que muestren interés por desarrollarse profesionalmente en elárea.  

7.1.1 Servicio socialEl servicio social es de suma importancia, especialmente si consideramos que el área esrelativamente nueva y los estudiantes tienen poca información sobre las ramas que abarca.

Mediante   el   cumplimiento   del   servicio   social,   el   estudiante   de   licenciatura   cubre   unrequisito   encaminado   a   la   titulación,   pero,   al   mismo   tiempo,   perfila   sus   interesesprofesionales. De este modo, actúa como un filtro: el estudiante tiene la opción de mantenerrelación con el grupo una vez concluido este servicio e incorporarse a proyectos conforme alas posibilidades del momento. Es deseable que quienes manifiestan simpatía por el árearealicen un trabajo de este tipo y así tomar la decisión de continuar o no por este camino demanera   fundamentada;   para   el   desarrollo   del   grupo   esto   es   muy   importante   pues   losproyectos se nutren de participantes entusiastas con las actividades que realizan,  lo quegarantiza un mejor rendimiento del proyecto y el crecimiento y consolidación del área.

7.1.2 Becarios en proyectosGracias al apoyo del Instituto de Ingeniería y con el patrocinio del CONACYT y de lapropia UNAM, el GIL ha venido realizando proyectos de investigación aplicada. 

El grupo, como parte del Instituto de Ingeniería, se sabe con una responsabilidad dentro dela   Universidad  y   la   sociedad,  que   es   la   de   coadyuvar   en   la   formación  de   los   futurosinvestigadores. Es por ello que procura que sus investigaciones no sólo sean realizadas porinvestigadores con experiencia, sino que vinculen a estudiantes con diferente formación yciclos académicos. Participar en proyectos de investigación desde las primeras etapas de losestudios   superiores   es   una   experiencia   de   aprendizaje   intensivo   que   complementa   laformación escolar de los alumnos.

El trabajo que desarrollan los becarios es fundamental para la formación individual de cadauno   de   ellos,   pero   también   es   benéfica   y   necesaria   para   la   consecución   de   nuestrosobjetivos. Ellos realizan tareas necesarias para las investigaciones que por limitaciones detiempo los responsables de los proyectos no podrían llevar a cabo sin descuidar otras paralas que se requiere una mayor experiencia. Y más  importante aún, aportan opiniones einiciativas desde una perspectiva diferente de los mecanismos y  las  ideas arraigadas dequienes concibieron los proyectos.

7.1.3 TesistasEn  cinco   años  el   grupo  ha   producido   una   cantidad   considerable  de  publicaciones  queconstituyen un registro del proceso y los mecanismos de los trabajos desarrollados hastaeste momento.

Entre estas publicaciones destacan las tesis de licenciatura, maestría y doctorado que losmiembros del grupo han desarrollado a partir de investigaciones personales insertas en losproyectos   del   grupo.   La   existencia   de   estos   trabajos   serios   que,   a   su   vez,   sonsistemáticamente documentadas ha impulsado un crecimiento efectivo del área.   Por las implicaciones positivas del desarrollo de esta actividad, seguiremos impulsando quemás estudiantes en cómputo, lingüística, bibliotecología, comunicación y disciplinas afines

con inquietudes en nuestra área desarrollen sus investigaciones dentro del grupo. Parte delos recursos en infraestructura y presupuesto de que dispongamos se destinarán a este rubro.

7.1.4 Intercambio académico: profesores invitados y estudiantes deintercambio

Tal como se mencionó en el punto 5 de este trabajo, el GIL cuenta con algunas experienciasen este sentido, tanto de participantes de nuestro grupo que han tenido estancias temporalesen otras instituciones como de estudiantes y profesores visitantes que hemos recibido.

Estos  antecedentes  nos  permiten evaluar  que,   si  bien  gracias  a   Internet  podemos   tenerconocimiento de  lo  que  actualmente se   realiza en materias  relacionadas a   la   ingenieríalingüística en otras partes del mundo, así como comunicación e intercambio constante conlos   investigadores,   las  estancias de  investigación son necesarias para  la  actualización ycapacitación de nuestro grupo.

Para expandir las investigaciones que se realizan en nuestro país a todas las ramas de laingeniería lingüística necesitamos conocer otras experiencias y qué mejor que contar conasistencia específicamente proyectada para los conocimientos y necesidades del GIL.  

Por otra parte, las estancias de miembros de nuestro grupo en otras universidades y centrosde   investigación   servirán   también   para   entablar   convenios   y   estrechar   los   lazos   decolaboración con las instituciones correspondientes.

7.2 Mecanismos de promociónCon miras a crecer en integrantes y, consecuentemente, en investigaciones y aplicaciones,necesitamos   poner   en   práctica   ciertos   mecanismos   de   promoción.   Hemos   optado   poralgunos que resultan novedosos y por otros que tradicionalmente se emplean para diversosfines, precisamente porque son exitosos.  

Los cursos que se imparten en diferentes  instituciones de educación superior cubren unprograma   y   propósitos   bien   definidos,   y   sirven   además   para   dar   a   conocer   entre   losestudiantes   la   existencia   de   un   grupo   de   investigación   dentro   de   la   UNAM  dedicadoexclusivamente   a   la   ingeniería   lingüística.   Los   seminarios   y   nuestra   participación   encongresos coadyuvan a este propósito. Sin embargo, lo anterior no garantiza llegar a todoslos espacios y personas, además de que esos eventos requieren de su propia promoción. 

7.2.1 Carteles y trípticosEs por esto que consideramos difundir mediante carteles las diversas actividades, así comoel uso de trípticos que permiten dar una información general pero concisa, tanto de qué es elGIL como de las actividades específicas que vayan surgiendo. 

7.2.2 Página WEBComo se ha mencionado en el punto 2 de esta III parte, el GIL cuenta con una nueva páginaen Internet. Se trata de hacer un diseño atractivo y de fácil acceso para los usuarios de laWEB, dado que es un medio de difusión cuyo impacto crece aceleradamente y del cualpretendemos hacer el mayor uso posible para difundir el área, además de que sirva comoforo para la gente que esté interesada en la ingeniería lingüística o alguna de sus ramas.

7.3 Estímulos económicosPara el GIL es una prioridad contar con los recursos para ofrecer estímulos económicos aquienes  participan   en   los  proyectos.  En   la  medida  en  que  haya una  base  de  personasdedicadas exclusivamente  al   trabajo  vinculado  con  los  proyectos  y   las   actividades  quellevamos a cabo, éstos asegurarán continuidad y las condiciones propicias para obtener losresultados   deseados:   los   integrantes   del   grupo   tendrán   la   facilidad   y   el   tiempo   parainvolucrarse a las diferentes tareas de acuerdo con sus  intereses cuando vean atenuadaspreocupaciones de otra naturaleza.

7.3.1 BecasHasta ahora las becas se han obtenido a partir de los proyectos patrocinados. Consideramospara este año las de CONACYT y DGAPA­UNAM, pero no se descartan las que pudieransurgir de nuevos convenios y proyectos con otras instituciones.  

7.3.2 HonorariosHasta el momento los estímulos se han otorgado mediante becas. No obstante, se ha visto lanecesidad de incorporar estímulos económicos de otro tipo, debido a que identificamos queexisten personas fuera del grupo que podrían aportar mucho al progreso de nuestro trabajo,y otras que perteneciendo al GIL no cuentan actualmente con  beca.

Se   ha   considerado   este   tipo   de   estímulos   al   momento   de   solicitar   el   patrocinio   deCONACYT y de otras entidades. El monto de estos estímulos se ajustaría a los tabuladoresde la UNAM y representaría un incentivo extra para quien esté interesado en el área.

7.4 Búsqueda de mecanismos de integraciónEs importante señalar que el GIL no es una entidad aislada, al contrario, a lo largo de suhistoria se ha demostrado la necesidad de trabajar de forma conjunta no sólo con la genteinvolucrada en el área, sino con áreas que pueden nutrirnos y áreas a las que podemosofrecer   productos.   De   aquí   la   exigencia   de   continuar   con   este   tipo   de   trabajo

interdisciplinario con las instituciones con las que ahora participamos, del mismo modo,que atraer la atención de  otras nuevas para seguir con el desarrollo y expansión del área.

7.4.1 Codirección de tesis Actualmente, además de las tesis desarrolladas por los integrantes del grupo y encaminadashacia proyectos específicos, se está comenzando a apoyar con asesoría y recursos, comoherramientas  informáticas y material bibliográfico, a estudiantes que sin participar en elGIL, elaboran tesis de temas relativos al área. 

Estos   mecanismos   repercutirán   en   un   acercamiento  con   otras   entidades   a   partir   de   lacodirección de tesis, por ejemplo, en donde quedará de manifiesto la interdisciplinariedaddel área y los niveles de expansión que puede llegar a tener.

7.5 Búsqueda de proyectos patrocinadosEn este 2004 concluyen los apoyos económicos asociados a trabajos de investigación conlos que actualmente contamos, por lo que hemos sometido a concurso en CONACYT unproyecto vinculado a un área de la que nos hemos ocupado. Además, se busca ampliar lasinvestigaciones hacia otras líneas que de la ingeniería lingüística que hasta ahora no hemosabordado,   para   lo   cual   necesitamos   asegurar   que   los   actuales   becarios   se   mantendrántrabajando en esta área y, al mismo tiempo, definir una estrategia para que otros estudiantescomiencen a vincularse. 

Los   proyectos   financiados   son   indispensables   para   el   crecimiento   de   los   trabajos   deingeniería  lingüística en nuestro país   porque redundan en mejores condiciones para  lainvestigación en todos los sentidos: Permiten proveernos de herramientas propicias paranuestro trabajo; asistir a eventos de intercambio académico, a programas de capacitación;acceder a becas, etc., por tal motivo, uno de los objetivos que a corto plazo tienen mayorprioridad es la de buscar y  obtener este tipo de patrocinio.

7.6 Red de trabajo del GILProblemas referentes al espacio físico y al equipo de cómputo por un lado, y de desarrollaruna gama diversa de líneas investigación, por otro, son una muestra que pone de manifiestola  necesidad de   trabajar   a   partir  de   redes.  Con  una  estructura  de   trabajo  basada en   lacooperación  y  dispersión  de   los   integrantes   se  pueden   aprovechar  de  mejor   forma  losrecursos disponibles y abarcar nuevos problemas de investigación, por tal motivo, en elGIL, esta  forma de trabajo  tiene gran importancia y se pretende seguir bajo este  rubrocolaborativo. 

Como   ejemplo,   la   estructura   actual   del   GIL   agrupa   a   miembros   que   desempeñanactividades de base, esto es, los que laboran físicamente dentro del Instituto de Ingeniería,

así como a miembros que colaboran en proyectos específicos desempeñando sus labores enotras instituciones dentro y fuera de la UNAM. 

7.6.1 UNAMComo ya se ha mencionado anteriormente, el GIL depende de la UNAM y físicamente selocaliza dentro de Ciudad Universitaria, lo que facilita su proyección dentro de la misma yque, consecuentemente, se nutra con sus estudiantes. 

Lo anterior ha permitido tener vínculos de trabajo con investigadores del IIFIL, el CELE, elCCADET, el IIMAS, la FES Acatlán, entre otras dependencias universitarias; sin embargo,pretendemos involucrar a otras dependencias que se interesen en esta disciplina y puedanaportar nuevas ideas con lo cual nutrir la investigación que desarrollamos.

7.6.2 ExteriorFuera de la UNAM, se cuenta con redes de colaboración con dependencias,  investigadores,profesores o prestadores sociales de otros centros de investigación nacional, tal es el casodel  IPN, el COLMEX, el INAOE y la ENAH.

En el extranjero existen mayores posibilidades de ampliar esta red a nivel de intercambioprecisamente porque existen más centros de investigación vinculados con el   trabajo delGIL,   algunas   instituciones   con   las   que   actualmente   colaboramos   son   el   InstitutoUniversitario de Lingüística Aplicada, de la UPF en Barcelona, y el Centro Nacional deMinería de Textos, en Manchester. 

No obstante  los vínculos de colaboración e intercambio que a la fecha tiene el GIL, esimportante seguir con esta estrategia para llegar a otros puntos nacionales y extranjeros. 

7.7 InfraestructuraUna necesidad inmediata que experimenta el GIL es la de ampliar su infraestructura debidoa que de la que se dispone actualmente es insuficiente para cubrir las necesidades del propiogrupo.

7.7.1 Espacio físicoEl   espacio   físico   del   que   se   dispone   dentro   del   Instituto   de   Ingeniería   no   es   nadadespreciable, pero plantea considerables dificultades. La primera es que este espacio estárepartido  en  cuatro  puntos  diferentes  dentro  de   tres   edificios,   lo   que  no  es  práctico  ydificulta la comunicación entre los miembros del grupo; por otra parte, no se cuenta con lacapacidad de albergar a los posibles nuevos integrantes.  

7.7.2 Equipo de cómputoDentro de  la solicitud de patrocinio que se ha presentado para  los próximos  tres años,destaca una partida que permita contar con nuevos recursos de cómputo, más adecuados alas necesidades específicas derivadas de las actividades que se realizan; esto no significaque el equipo con el  que contamos sea despreciable, sino que muestra  la necesidad deactualización y de ofrecer mayores recursos a los integrantes del grupo para realizar sustrabajos de mejor forma.

8. Consolidación de líneas de investigaciónUna   tarea   importante   en   el   crecimiento   del   GIL   es   la   de   profundizar   y   extender   loshorizontes de investigación del grupo. No basta con el desarrollo de un único rubro paradestacar en el ámbito de investigación, pero tampoco es posible abarcar todas las líneas deuna disciplina, en el GIL se ha privilegiado el desarrollo de investigación básica y aplicadaen la esfera textual de la ingeniería lingüística, pero esto no significa que se desdeñen otraslíneas que no tengan que ver con ésta o algunas otras nuevas. 

En  los apartados siguientes se hablará  a grandes rasgos de  las  líneas existentes  que hadesarrollado el grupo, la consolidación de éstas, y el ingreso paulatino hacia nuevas líneas.

8.1 Líneas existentesA la  fecha  las   líneas de  investigación que el GIL ha desarrollado están en función deinformación   textual   básicamente;   investigaciones   en   terminología,   terminótica,lexicografía,   bancos   terminológicos,   entre   otras,   han   rendido   bastante   fruto   y   hanrepresentado ante   la   comunidad nacional   e   internacional   el  desarrollo   que  el  grupo hatenido;  sin  embargo,  aún restan diversos   rubros referentes a   la   información  textual  porinvestigar, que a lo largo del desarrollo de los proyectos han aparecido, pero que por elmomento no ha sido posible abordar.

Cabe destacar que todas las líneas de investigación que se han trabajado en el GIL partendel desarrollo del proyecto central de investigación del grupo, dicho proyecto se refiere a laconstrucción   de   un   diccionario   electrónico   integral   de   búsquedas   semasiológicas   yonomasiológicas. A partir de este proyecto se han generado y diversificado las líneas deinvestigación   del   grupo   hacia   distintos   ámbitos   tanto   a   nivel   lingüístico   comocomputacional.

Ahora bien, la meta que como grupo perseguimos no es sólo probar y diversificar en líneasde investigación, sino explotar y profundizar lo más posible en las que ahora desarrollamos,para a la par y posteriormente, incursionar en otras nuevas que tengan el sustento de trabajode las anteriores.

8.2 Nuevas líneas de investigaciónAsí   como es   importante   afianzar  y   seguir   con   las   líneas  actuales   de   investigación,   esnecesario incursionar en otras para expandir los horizontes de la investigación en ingenieríalingüística en México. Algunas líneas se han contemplado desde hace tiempo en el GILpero, dada la cantidad de trabajo, ha sido casi imposible acercarnos mayormente a ellas;algunas   otras   han   ido   descubriéndose   a   partir   de   la   investigación   y   trabajo   quedesarrollamos con las actuales.

8.2.1 CapacitaciónPara poder incursionar a nuevas líneas de investigación, primero es necesario capacitarse.En este sentido, el GIL cuenta con los recursos necesarios y los convenios indicados paraque sus miembros puedan capacitarse en los centros especializados en donde se realiza talinvestigación.

8.2.2 Búsqueda bibliográficaDe igual manera, es imprescindible documentarse para tener referentes básicos y sólidossobre   las   nuevas   líneas,   por   tal   motivo,   la   búsqueda   de   material   bibliográfico   es   unprerrequisito para acceder e estas nuevas líneas.

Con el  apoyo de  la  Dirección General de Bibliotecas  (DGB), a  partir  de  la  Unidad deServicios de Información (USI) del Instituto de Ingeniería se garantiza la obtención de estosrecursos.

8.2.3 ColaboraciónOtro punto importante es la colaboración entre especialistas y el GIL para asegurar, primerola capacitación, y luego, el desarrollo de la investigación por caminos fundamentados. 

9. Integración del GIL con el exteriorUna   de   las   preocupaciones   más   importantes   al   interior   del   GIL   es   el   futuro   de   losintegrantes del grupo. Una vez que  los miembros hayan adquirido  los conocimientos yexperiencia necesaria para desarrollarse por su cuenta o paralelo al GIL, cuál es el caminoque les ofrece esta disciplina. 

9.1 Canalización de los miembros del GIL al mundo laboralLa principal rama laboral a la que los integrantes del GIL acceden es la docencia. En laactualidad  son nueve miembros del grupo los que participan de forma activa en actividadesdocentes relacionadas con la ingeniería lingüística o alguna de las ramas que la constituyen,

en instituciones de educación superior y de posgrado, tanto en la   UNAM como fuera deella7. 

Sin embargo, no sólo  la docencia constituye el único vínculo entre el GIL y el mundolaboral. Actualmente, y gracias a la participación en diferentes foros de difusión nacionalese   internacionales,   así   como   a   asociaciones,   institutos   y   demás   medios   de   relacionespúblicas, se han concretado algunos convenios para que los integrantes del GIL que deseeny estén capacitados, puedan realizar estancias de investigación en universidades extranjeras,por ejemplo, el   Institut  Universitari  de Lingüística Aplicada de  la Universidad PompeuFabra en Barcelona. 

De igual forma, a nivel nacional hay un panorama laboral bastante amplio en la iniciativaprivada y en las entidades gubernamentales. En el  primer  rubro, empresas dedicadas aldiseño   de   sistemas   inteligentes   y   de   procesamiento   de   lenguaje   natural   requieren   depersonal preparado para el desarrollo de sus sistemas, tal es el caso de TELMEX. Por ellado   gubernamental,   entidades  como  la  Procuraduría General  de   Justicia   del  DF  estáninteresadas en profesionales que puedan desarrollar los sistemas de acústica forense, o elTribunal Electoral del Poder Judicial de la Federación, en donde se precisa de gente quedesarrolle buscadores con bases lingüísticas y computacionales.

No obstante que la ingeniería lingüística es un área de reciente creación en México, lasnecesidades   que   plantea   el   mundo   actual   hacen   que   se   requiera   cada   vez   más   deprofesionales   en   el   área   que   puedan   investigar,   capacitar   y   desarrollar   sistemas   queredunden en beneficio de la sociedad. La ingeniería lingüística como área interdisciplinariaofrece profesionales preparados y con una visión complementaria de las ciencias y de lashumanidades al mundo laboral.

9.2 CENTLICEl rápido crecimiento de los alcances de la ingeniería lingüística y de esta misma como áreainterdisciplinaria ha dado lugar a la inquietud de varios investigadores y estudiantes de estaárea en México, a expandir los alcances de investigación, desarrollo y aplicación a través deun centro que logre englobar lo más posible las diferentes ramas que nutren la ingenieríalingüística. 

El Centro de las Tecnologías del Lenguaje, la Información y el Conocimiento (CENTLIC)es un nuevo proyecto, comandado por el GIL, con la participación de centros universitariostales  como el CUIB, el   IIMAS, el CCADET, el   II,   la   facultad de filosofía y  letras,   lafacultad de ingeniería y el CELE, y de centros externos como el COLMEX, el INAOE, elCIC, la BUAP, entre otros; que pretende reunir a la mayoría de expertos y estudiosos en lasramas que conforman la ingeniería lingüística con el fin de crear una entidad que pueda darel soporte necesario y suficiente a las necesidades sociales y de investigación relacionadas

7 Para consultar los cursos que han impartido los miembros del GIL, consulte el Apéndice B.

con el procesamiento de lenguaje natural, el procesamiento de textos y de información y lageneración de conocimiento.

Con   este   centro   se   pretende   involucrar   a   todos   los   que   están   trabajando   de   formaindependiente en cuestiones relativas a  las arriba mencionadas y conjuntar una base deprofesionales que trabajen para un fin común y bajo una sólo entidad.

El CENTILC es el objetivo más ambicioso, a la vez que sustentado por el trabajo que se hevenido desarrollando en la UNAM y fuera de ella, de la comunidad mexicana dedicada ycomprometida con esta área. El logro del objetivo depende del esfuerzo y dedicación quetodos los involucrados realizan día con día y el de tener presente que se trabaja en pro de lainvestigación mexicana de calidad.

APÉNDICE A

 INSTANCIAS EDUCATIVAS Y DE INVESTIGACIÓN

A continuación se mencionarán de manera más amplia algunos lugares e instituciones en elmundo, los cuales dedican de gran manera sus esfuerzos al desarrollo e investigación deesta industria, así como las respectivas ligas para profundizar o contactar con la institución.

Instancias Educativas e Investigación

1. América

• Canada

o Alberta

University of Calgary: Dept. of Linguistics 

o British Columbia 

Simon Fraser University, Burnaby: Natural Language Laboratory 

o Manitoba 

University of Manitoba: Dept. of Linguistics 

o Ontario 

University   of  Ottawa:  Knowledge   Acquisition   and   MachineLearning (KAML) Group, Department of Computer Science 

University of Toronto Department of Computer Science 

o Quebec 

CEVEIL    (Information on Language Engineering in Quebec) 

Concordia  University   ,  Montreal,  Center   for  Pattern  Recognitionand Machine Intelligence 

• USA

o Arizona

Tucson: University of Arizona, Department of Linguistics 

o California

Stanford   University,   Center   for   the   Study   of   Language   and   Information and the CSLI HPSG Project 

University of California at    San Diego    

Center for Research in Language    

University of California at    Santa Barbara   , Dept. of Linguistics    

University of California at    Berkeley    

ICSI    (International Computer Science Institute) 

Computer Science Division    

Linguistic Department    at UCLA 

Menlo Park: SRI International, Artificial Intelligence Center withtheir Natural Language Program 

Marina   del   Rey:  Natural   Language   Processing   at   theInformational Science Institute, University of Southern California(ISI) 

UC Davis: Linguistics Program at . 

o Connecticut 

Linguistics Department    of Yale    University    

Delaware  University   of     Delaware   :  Applied   Science   andEngineering Laboratories with their 

Speech Group   , 

Natural Language Interfaces Group    

o and a description of their Language Representation Database 

o District of Columbia 

Georgetown University: Computational Linguistics    

o Florida 

Florida International University Linguistics Course Descriptions    

o Georgia Atlanta: 

Georgia Tech Cognitive Science program    

Georgia Tech Natural Language and Reasoning research group    

o Illinois 

Southern   Illinois   University   at  Carbondale:  Department   ofLinguistics 

University of    Chicago    

Dept. of Linguistics (graduate program)    

Northwestern University   , Department of Linguisitics 

o Indiana 

Bloomington:  Indiana   University,   Department   of   CognitiveScience, 

o Iowa 

Linguistics Department at The University of Iowa    

o Kansas 

The Linguistics Department, University of Kansas    

o Maryland 

Baltimore:  Department of Cognitive Science  of  Johns HopkinsUniversity 

o Massachusetts 

University   of   Massachusetts   ,  Amherst,  Center   for   IntelligentInformation Retrieval (CIIR) 

MITRE   , Bedford, Intelligent Information Processing 

Massachusetts   Institute   of   Technology     (MIT),  Cambridge,Department of Linguistics and Philosophy 

Brandeis University   , Waltham, Department of Computer Science,Research Lab for Linguistics and Computation (RLLC) 

o New Mexico 

Las Cruces: New Mexico State University 

Computing Research Lab    

Department of Languages and Linguistics    

o New York 

Ithaca: Cornell University 

Noyes Lodge Language Learning Center   , Department of ModernLanguages and Linguistics 

Natural   Language   Processing   group   ,   Departments   of   Science,Linguistics, and Psychology 

University of New York at  Stony  Brook:  Semantics Lab at theDepartment of Linguistics. (also available: Language, Journal ofthe Linguistic Society of America) 

New York: New York University 

Linguistics Department    

CS Department, Proteus Project    and their Technical Reports 

University of Rochester: Linguistics Department 

o Ohio 

Columbus: Ohio State University, Department of LinguisticsThere is also an HPSG­Server 

o Oregon 

Portland:  The   Oregon   Graduate   Institute   of   Science   andTechnology, Center for Spoken Language Understanding 

Department of Linguistics   , University of Oregon. Also availableare 

The Yamada Language Center WWW language guides    and 

their   language­related  font   archives   (Includes   several   phonetic   fonts). 

o Pennsylvania 

o Pittsburgh: Carnegie Mellon University 

Center for Machine Translation    

Languages and Linguistics    

Computational Linguistics Program    

o Philadelphia: University of Pennsylvania 

Linguistics Department    

Computer & Information Sciences    

Linguistic Data Consortium (LDC)    

o Rhode Island 

Brown   University,   Department   of   Cognitive   and   Linguistic   Sciences, Providence, RI. 

o Texas 

University of Texas at Austin: Department of Linguistics 

Houston: Rice University, Center for the Study of Languages 

Dallas: Summer Institute of Linguistics (SIL) 

Linguistics Department    at Brigham Young University 

o Washington 

Western Washington University   ,  Bellingham, Computer ScienceDepartment 

o University  of Washington,  Seattle:  Chinese dialect society (The YuenRen Society) and the journal The Treasury 

• Brazil

Universidade Federal de Santa Catarina   , Florianópolis, Núcleo dePesquisas em Informática, Lingüística e Literatura (NUPILL) 

Universidade de    São      Paulo    

Laboratório de Inteligência Computacional    

Núcleo Interinstitucional de Lingüística Computacional    (NILC) 

2. Europa

• Austria 

Universität    Innsbruck   , Institut für Sprachwissenschaft 

University of     Vienna   ,  Austrian Research Institute  for ArtificialIntelligence (OFAI) 

• Bélgica 

Katholieke   Universiteit     Leuven   ,  Centre   for   ComputationalLinguistics 

Université   catholique   de     Louvain   ,  Centre   for   English   CorpusLinguistics (CECL) 

University   of     Liège   ,  Department   of   English   Language   andLinguistics 

• Bulgaria 

Bulgarian   Academy   of   Sciences,  Sofia,  Linguistic   ModellingLaboratory 

University of     Plovdiv   ,  Faculty of Mathematics and InformationTechnologies, Computer Science Department 

• Croacia 

University   of  Zagreb,  Faculty   of   Philosophy,  Institute   ofLinguistics 

• República Checa 

Masaryk University   , Brno, Faculty of Informatics, Department ofInformation Technology 

Institute of the Czech National Corpus    

Charles University    Prague   , Linguistic Data Lab 

• Dinamarca 

University of Aarhus   , Institut for Linguistik 

University of    Copenhagen   , Faculty of Humanities 

Centre for Language Technology    (CST) 

Department of General and Applied Linguistics    (IAAS) 

Odense     University   ,  Maersk   Mc­Kinney   Moller   Institute   forProduction Technology, Natural Interactive Systems Group 

• Estland 

University   of     Tartu   ,  Research   Group   of   ComputationalLinguistics 

• Finlandia 

University of    Helsinki    Department of General Linguistics 

• Francia 

Université de Provence   ,  Aix­en­Provence,  Laboratoire Parole etLangage 

Universite d'   Avignon   , Laboratoire d'Informatique    

University   of     Caen   ,  Groupe   de   Recherches   En   Informatique,Image, Instrumentation de Caen (GREYC), Artificial Intelligence

Ecole Nationale Superieure de    Fontenay/Saint­Cloud   , Analyse deCorpus Linguistiques, Usages et Traitements 

o Grenoble 

Université   Joseph   Fourier,  Communication   Langagieres   etInteraction Personne Systeme (CLIPS) 

ICP, European Speech Communication Association (ESCA) 

Université Stendhal, Institut National Polytechnique/Institut de laCommunication Parlée 

Universitié de    Marne­la   ­  Vallée   . Centre d'Études et de Recherchesen Informatique Linguistique (CERIL)

Université  de     Nantes   ,  Faculté  des  Sciences  et  Des TechniquesInstitut de Recherche en Informatique de Nantes, Équipe LangageNaturel (LN) 

o Paris 

Université Paris 7    

Laboratoire d'Automatique Documentaire et Linguistique   (LADL) 

Campus­Jussieu   ,  Linguistics   Department,  TraitementAutomatique du Langage Naturel (TALANA) 

• Alemania: 

o Berlin 

Humboldt­Universität   , Philosophische Fakultät II, Institutfür deutsche Sprache und Linguistik 

Lehrstuhl für Computerlinguistik    

Projektgruppe Strukturelle Grammatik    

Technische   Universität   Berlin   ,  Fachbereich   Informatik,Projektgruppe KIT 

Geisteswissenschaftliche   Zentren   Berlin   e.V.   (GWZ)   ,Zentrum  für  Allgemeine Sprachwissenschaft,  Typologieund Universalienforschung (ZAS) 

Universität     Bielefeld       ,  Fakultät   für   Linguistik   undLiteraturwissenschaft,  Arbeitsgruppe   Computerlinguistikund Texttechnologie 

Ruhr­Universität     Bochum   ,  SprachwissenschaftlichesInstitut 

Rheinische Friedrich­Wilhelms­Universität     Bonn   ,  Institutfür Kommunikationsforschung und Phonetik 

Universität    Duisburg   , Computerlinguistik 

o Erlangen 

Friedrich­Alexander Universität Erlangen­Nürnberg    

Artificial Intelligence    

Computational Linguistics    

FORWISS Erlangen    

Universität   Gesamthochschule     Essen   ,  ArbeitsbereichLinguistik 

Albert­Ludwigs­Universität     Freiburg   ,  ArbeitsgruppeComputerlinguistik 

Georg­August­Universität     Göttingen   ,  PhilosophischeFakultät,  Seminar fuer Allgemeine und IndogermanischeSprachwissenschaft 

FernUniversität    Hagen   , Applied Computer Science VII 

University of    Hamburg    

Department of Computer Science    

Natural Language Systems Division    (NatS) 

Knowledge and Language Processing    (WSV) 

University of    Heidelberg   , Chair for Computional Linguistics 

University of    Koblenz   , Institute for Computational Linguistics 

University   of     Cologne     (   Köln   )  ,  Department   of  Linguistic   DataProcessing 

Otto­von­Guericke­Universität     Magdeburg   ,  Institut   fürWissens­   und   Sprachverarbeitung,  ArbeitsgruppeAngewandte   Informatik   ­  Wissensbasierte  Systeme undDokumentverarbeitung 

Institut für Deutsche Sprache   , Mannheim 

o München 

Goethe­Institut   , Head Office, München 

Ludwig­Maximilians­Universität München    

Centrum für Informations­ und Sprachverarbeitung    (CIS) 

Institute of Phonetics and Speech Communication    (IPSK) 

Westfälische   Wilhelms­Universität     Münster   ,  ArbeitsbereichLinguistik 

Universität  Osnabrück,  Institut   für   SemantischeInformationsverarbeitung 

University of    Passau   , Lehrstuhl für Allgemeine Linguistik 

Universität    Potsdam    

Institut für Germanistik   , Abteilung Sprachwissenschaft 

Institut für Linguistik    

Universität    Regensburg   , Institut für Informationswissenschaft 

Saarbrücken 

German   Research   Center   for   Artificial   Intelligence   (DFKI),   Saarbrücken, Language Technology Lab 

Universität des Saarlandes    

Computerlinguistik    

Institut für Angewandte Informationsforschung (IAI)    

Universität    Stuttgart    

Institut für Informatik, Abteilung Intelligente Systeme    

Institut für Linguistik/Germanistik    

Institut für Linguistik/Romanistik    

Institut für maschinelle Sprachverarbeitung (IMS)    

Universität     Trier   ,  LinguistischeDatenverarbeitung/Computerlinguistik 

Universität    Tübingen    

Deutsches Seminar    

Seminar für Sprachwissenschaft    

• Gran Bretaña 

University of    Birmingham    

Corpus Linguistics Group, School of English    

Cognitive Science Research Centre    

University   of     Brighton   ,  Information   Technology   ResearchInstitute 

University of    Cambridge    

Department of Engineering, Speech, Vision and Robotics (SVR)   Group 

Natural Language Processing Group    

University of    Durham    (LOLITA Project)    

University of    Edinburgh   : 

Centre   for   Cognitive   Science   and   the   Human   Communication Research Centre 

The Centre for Cognitive Science (CCS)    

The Human Communication Research Centre (HCRC)    

The   European   Network   in   Language   and   Speech   (ELSNET) 

The Association for Computational Phonology    

Language Technology Group     (see also  LTG's HelpdeskFAQ 

Language   Technology   Group,   NLP­Software   Enquiry   Service 

The Centre for Neural Systems (CNS)    

Department of Artificial Intelligence    

Department of Linguistics    

University of    Essex    

CL/MT Research Group    

Department of Language and Linguistics    

Lexical Functional Grammar (LFG) server    

Linguistics Association of Great Britain    

Lancaster      University    

University   Centre   For   Computer   Corpus   Research   on   Language (UCREL) (good Index there!) 

Department of Linguistics and Modern English    

University of    Leeds    

Speech Lab    

Computer Based Learning Unit    

School   of   Computer   Studies   ,  Centre   for   ComputerAnalysis of Language and Speech 

University   of     Liverpool   ,  Research   and   Development   Unit   forEnglish Studies 

University of London 

Birkbeck College   , Department of Applied Linguistics 

City   University   ,  School   of   Informatics,  InformationScience 

Imperial College   , Department of Computing 

King's   College   ,  Department   of   Philosophy,Computational Linguistics and Formal Grammar 

School   of   Oriental   and   African   Studies     (SOAS),Department of Linguistics 

University College London   , Department of Phonetics andLinguistics 

University  of     Manchester     Institute  of  Science and Technology   (UMIST) (not part of U Manchester),Department of Language Engineering 

Reading     University   ,  Department of Linguistic  Science,  SpeechResearch Laboratory 

University of    Sheffield   , , Department of Computer Science, NLPResearch Group 

University   of     Sussex   ,  School   of   Cognitive   and   ComputingSciences, Computational Linguistics Group 

University of    Sunderland   , School of Computing and InformationSystems 

University of     Wolverhampton     at  Dudley   ,  School of Languagesand European Studies 

• Hungría 

Lajos Kossuth University   , Center for Applied Linguistics 

Hungarian Academy of Sciences,  ,     Budapest   , Research Institute   for Linguistics 

• Irlanda: 

o Dublin 

Dublin City University, School of Computer Applications    

University   of   Dublin,  Trinity   College,  Computer   ScienceDepartment 

University of    Limerick   : NLP in Ireland 

• Italia: 

European Academy    Bolzano    

Consiglio Nazionale delle Ricerche (C.N.R.)   , Pisa 

Istituto di Linguistica Computazionale    

Istituto di Elaborazione dell'Informazione    

University of Rome 

"La Sapienza"    

University   of   Rome   "Tor   Vergata"   ,  Computer   ScienceLaboratory,  Gruppo per l'Elaborazione del Linguaggio Naturale(GELN) 

Istituto per la Ricerca Scientifica e Tecnologica (IRST)   , Trento 

Divisione tecnologie cognitive e della comunicazione    

Sistemi per il Ragionamento Automatico    

Tuscan Word Centre   , Pescia 

Universita'  Ca'   Foscari   di     Venezia   ,  Laboratorio  di   LinguisticaComputazionale 

• Latvia

University   of   Latvia,  Riga,  Institute   of   Mathematics   andComputer Science 

• Lituania 

Vytautas Magnus University,  Kaunas,  Center of ComputationalLinguistics 

• Malta 

University of Malta   , Institute of Linguistics 

• The Netherlands 

University of    Amsterdam    

Institute of Phonetic Sciences    

Institute for Logic, Language and Computation    

Centrum voor Wiskunde en Informatica (CWI)    

Institute of Phonetic Sciences (IFA)    

University of Groningen 

BCN Linguistics & Cognitive Sciences    

Vakgroep Alfa­informatica    

University of    Nijmegen    

AGFL (Affix Grammars over a Finite Lattice) Project    

Department of Language and Speech    

TOSCA corpus linguistics research    

Twente University in Enschede, Computer Science Department 

Utrecht University, Utrecht institute of Linguistics (OTS) 

• Norway 

University   of  Bergen,  Norwegian   Computing   Centre   for   theHumanities (NCCH) 

University   of     Oslo   ,  Department   of   Linguistics,   The   TextLaboratory 

• Polonia 

University of Wroclaw   , Institute of English Philology 

CLIP Computational linguistics in Poland (link collection)    at IPIPAN   Instytut   Podstaw   Informatyki   Polskiej   Akademii   Nauk(Institute   of   Computer   Science   of   the   Polish   Academy   ofSciences) 

• Portugal 

Universidade   Técnica   de     Lisboa   ,  Instituto   Superior   Técnico,Centro de Automática, Laboratório de Engenharia da Linguagem(LabEL) 

• Rumania 

Romanian   Academy,   Section   of   Information   Science   andTechnology,  Bucharest,  Center   for   Advanced   Research   inMachine Learning, Natural Language Processing and ConceptualModelling 

University "A.I.Cuza" Iasi, Faculty of Computer Science, NaturalLanguage Processing Group 

• Rusia 

Russian Academy of Sciences, Moscow: 

Laboratory of Computational Linguistics    

Institute of Linguistics    

• Eslovenia 

Jozef   Stefan   Institute   ,  Ljubljana,  Department   of   IntelligentSystems 

• España: 

Barcelona: 

Universitat   Politècnica   de   Catalunya   ,  Departament   deLlenguatges i Sistemes Informàtics 

Universitat   Pompeu  Fabra   ,  Institut   Universitari   de   LingüísticaAplicada 

University   of     Corunna   ,  Deptartment   of   Computer   Science,Compilers and Languages 

• Madrid 

Universidad   Autonoma  de     Madrid   ,  Laboratorio  de  LingüísticaInformática 

Universidad   Europea   de   Madrid   ,  Escuela   Superior   deInformatica, Departamento de Inteligencia Artificial 

Royal Spanish Academy    

Universidad de     Málaga   ,  Departamento de Lenguajes y Cienciasde la Computación 

Rovira   I   Virgili   University   ,  Tarragona,  Research   Group   onMathematical Linguistics and Language Engineering (GRLMC) 

Universidad   de   Las   Palmas   de   Gran   Canaria,   Depto.   de   Informática y Sistemas , Las Palmas de Gran Canaria 

• Sweden: 

Göteborg    University   : 

Faculty of Arts & Humanities    

Computational Linguistics Joint Programme    

Linguistics Dept.    

Swedish   Institute   for   CS   (SICS),     Kista   ,  Human   ComputerInteraction and Language Engineering (HUMLE) 

o Stockholm

Stockholm       University   , Department of Linguistics 

Royal Institute of Technology (KTH),    Stockholm   : 

Centre for Speech Technology (CTT)    

Department of Speech, Music and Hearing (TMH)    

Umeå    University   , Department of Linguistics 

Lund    University    

Department of Linguistics    

Cognitive Science Department    

Uppsala    University    

Department of Linguistics    

Language Engineering Programme    

• Switzerland 

University of    Geneva      

ISSCO     (Institut   Dalle   Molle   pour   les   Etudes   Semantiques   etCognitives) 

LATL    (Laboratoire d'Analyse et de Technologie du Langage) 

Université de    Lausanne   , Linguistics Department    

University of    Zürich   , Computational Linguistics Group 

• Turquía 

Bilkent   University,     Computer   Science   Department,  TurkishNatural Language Processing Project 

Middle   East   Technical   University   ,  ODTÜ   (METU)   ­   LcsL,Laboratory for the Computational Studies of Language 

• Ucrania 

o Severodonetsk Institute of Technology    

3. Asia

• China 

Hong      Kong    University of Science and Technology    ,  Department ofComputer Science, Human Language Technology Center 

• India 

Indian Statistical Institute   , Calcutta 

National   Center   for   Software   Technology     (NCST),  KnowledgeBased   Computer   Systems,  Natural   Language   Processing   andInformation Retrieval Group 

University   of     Hyderabad   ,  Department   of   Computer/InformationSciences 

• Israel 

Tel Aviv University, Department of Hebrew and Semitic Languages 

Bar­Ilan   University   ,  Department   of   Mathematics   and   ComputerScience,  Institute   for   Information   Retrieval   and   ComputationalLinguistics 

Weizmann Institute  of Science   ,  Rehovot,  Faculty of MathematicalSciences 

• Japón: 

Communications Research Laboratory    (CRL) 

Japan Electronic Dictionary Research Institute    (EDR) 

Japan   Advanced   Institute   of   Science   and   Technology     (JAIST),Hokuriku, Ishikawa prefecture 

Kyushu   Institute   of   Technology,  Department   of   ArtificialIntelligence, Iizuka, Fukuoka 

ATR    Interpreting Telecommunications Research Laboratories   , Kyotoprefecture 

Kyoto    University   , Language Media Laboratory 

Nara Institute of Science and Technology     (NAIST),  ComputationalLinguistics Laboratory, Nara prefecture 

• Tokyo 

National Institute of Informatics (   NII   ) (formerly    NACSIS   )   

Tokyo Institute of Technology    

University  of  Tokyo,  Department  of   Information  Science,  Natural   Language Processing 

Electrotechnical Laboratory,    Tsukuba    

• Korea 

Electronics  and Telecommunications Research  Institute   ,  Computerand Software Technology 

Korean Advanced Institute of Science and Technology   ,  Center forArtificial Intelligence Research 

Korea University   , Natural Language Processing Lab. 

• Seoul 

Yonsei University   , Center for Linguistic Informatics Research 

• Malasia 

University   Sains   Malaysia,  Penang,  Computer   Aided   TranslationUnit (UTMK) 

• Singapur 

Kent Ridge Digital Labs   , Knowledge Lab 

• Tailandia 

Southeast Asian Software Research Center   , Bangkok 

4. África

• Sudáfrica

University of Natal,    Durban   , Department of Linguistics 

5. Oceanía

University of Queensland   ,  Brisbane,  Centre for Language Teaching andResearch (CLTR) 

Monash University   , Clayton, Department of Linguistics 

University   of     Melbourne   ,  Department   of   Linguistics   &   AppliedLinguistics 

University of Western Australia   , Perth, Hellenistic Greek Linguistics 

• Sydney 

Macquarie University in Sydney, Department of Computing    

University of Sydney    

Department of Linguistics    

University   Language   Technology   Research   laboratorY   (SULTRY) 

APÉNDICE B

DOCENCIA

A continuación se anotan los distintos cursos relacionados con el estudio y la difusión de laingeniería lingüística dentro de instituciones de educación superior, impartidas por algunosmiembros del GIL.

Curso  “Aplicaciones de  Ingeniería Lingüística”,  Posgrado en Lingüística  Hispánica,UNAM.Curso “Métodos cuantitativos”, Posgrado en Lingüística Hispánica, UNAM.Curso “Minería de textos”, Posgrado en Ciencias de la Computación, UNAM.Curso “Procesamiento de Lenguaje Natural en Python”, Posgrado en Ciencias de laComputación, UNAM.Curso “Temas especiales de computación”, Facultad de Ingeniería, UNAM.Curso “Estructuras discretas”, Facultad de Ingeniería, UNAM.Curso “Introducción a la ingeniería lingüística”, Facultad de Filosofía y Letras, UNAM.Curso “Optativa de Lingüística”, Facultad de Filosofía y Letras, UNAM.Curso “Bases de datos”, Facultad de Contaduría y Administración, UNAM. Curso   “Desarrollo   de   aplicaciones   en   RDBMS”,   Facultad   de   Contaduría   yAdministración, UNAM.Curso” Programación de interfaces”, Facultad de Contaduría y Administración, UNAM.Curso “Sistemas operativos”, Facultad de Contaduría y Administración, UNAM.Curso   “Administración   de   recursos   informáticos”,   Facultad   de   Contaduría   yAdministración, UNAM.Curso  “Bases  de  datos  postrelacionales”,  Facultad  de  Contaduría y Administración,UNAM.Curso “Taller de Visual Basic 6.0”, Facultad de Contaduría y Administración, UNAM.Curso “Métodos cuantitativos”, Escuela Nacional de Antropología e Historia, ENAH.Curso   “Lingüística   computacional”,   Escuela   Nacional   de   Antropología   e   Historia,ENAH.Curso “Semiótica”, Instituto Francés para América Latina, IFAL.Curso   “Procesamiento   digital   de   imágenes”,   Escuela   Nacional   de   EstudiosProfesionales, Aragón. 

APÉNDICE C

DESARROLLOS

En esta sección se enumeran algunos de los desarrollos, sistemas y productos que han sidoproducidos por distintas compañías y/o instituciones de investigación.

Lingüística Empresa ProductoComputational Linguistics andLanguage Technology

DFKI L LTCOLLATE:

Deep Linguistic Analysis inVerbmobil

DFKI L LTVM­DEEP:

Distributed European LinguisticResource Repository

DFKI L LT RELATOR:

Finite relation expressionnetwork

Lexical FreeNet 

Formalisms Working Group EAGLESGerman Text Exploitation DFKI L LT GETESS:Grammar Checker DFKI L LT FLAG:Grammatifix Lingsoft Grammatifix SPG UB The Babel system. An HPSG­based parser for

German

Tabla 7: Desarrollos en lingüística general

Fonética y Fonología Empresa ProductoComputational phonology SIGPHON (SIGPHON) Analyse phonetic data SIL FindPhoneANLD UCCL Alvey Natural Language Tools Automatic speech based service Telia Promotor Självbetjäning Intelligent dialog DFKI L LT INTERPRICE:Multilingual voice Lingsoft  Parrot Phonetic Training Tools  PTTSpeech recognition Scansoft  Dragon NaturallySpeaking 

Tabla 8: Desarrollos en fonética y fonología

Morfología Empresa ProductoComputational Morphology andphonology

SIL Computational Morphology and Phonology (SIL) 

Morphological analyser CLUE Amalgam ­ Malaga. Morphological parser SIL AMPLE Processor for two­levelphonology and morphology

SIL PC­KIMMO

Spell and grammar checker.  Euroling  Granska 

Tagger Connexor Oy  Connexor Machinese Phrase Tagger Tagger CLUZ A rule­based part­of­speech taggerStatistical Part­of­SpeechTagging

US The TnT Tagger (for DE and EN)

Tabla 9: Desarrollos en el nivel morfológico

Sintaxis Empresa ProductoConnexor Machinese Syntax  Connexor Oy  Connexor Machinese Syntax Constraint Grammar  Tools  Lingsoft AB  CGDT English parsing software Ergo Linguistic TechnologiesMachinese Phrase Tagger Connexor  FDG lite parserMachinese Syntax  Connexor  FDG lite parserParser UA A constraint­based syllable parser Parser DCSNYU Apple Pie ParserSyntactic parser  SIL PC­PATR 

Tabla 10: Desarrollos en el nivel sintáctico

Semántica Empresa ProductoMachinese Semantics. Connexor  FDG lite parserMultilingual ConceptHierarchies 

DFKI L LT MUCHMORE:

Tabla 11: Desarrollos en el nivel semántico

Léxico Empresa ProductoLexical platform for the Spanishlanguage 

UPM – UAM ARIES Natural Language Tools

Managing lexicon SIL MacLex Online lexical reference system  PU WordNet

Tabla 12: Desarrollos en el nivel léxico

Herramientas Empresa ProductoAutomatic text summarization Euroling  SweSum Diagnostic and Evaluation toolsfor Natural LanguageApplications

DFKI L LT DiET:

Dialog system  DISCODictate rapports, e­mail andother documents by talking tothe computer. 

Voxit  Voice Xpress 

Disclosure and dissemination ofdocuments

DFKI L LT TWENTYONE:

Integrated translationenvironment 

Atril  Déja Vù 

Multilingual InformationExtraction

DFKI L LT MIETTA:

Multi­lingual SummarisationTool

DFKI L LT MUSI:

Question­Answering System DFKI L LT QUETAL:Tool for developing and testing models ofregular historical sound change 

Phono version 4.1

Tool for sound visualization andmanipulation.

Centrum förtalteknologi

WaveSurfer 

Tools for annotating linguisticsignals

Annotation Graph Toolkit

Tabla 13: Herramientas

APÉNDICE D

ASOCIACIONES

A   continuación   se   enumeran   algunos   grupos   y   asociaciones   dedicadas   el   estudio,   lainvestigación y la difusión de la ingeniería lingüística.

Nombre Categoría Área de Investigación LugarComputational Linguistics &Phonetics Dep.

Departamento Semántica formal Saarlandes, Alemania

Teoría sintáctica http://www.coli.uni­sb.de/Interfaz sintaxis­semánticaModelos cognitivosProcesamiento de textoFonética­fonologíaTecnologìas del hablaExtracción de informaciónCorpus Lingüísticos

HPSG Tübingen Grupo Gramática formal (HPSG) Tübingen, AlemaniaCorpus lingüísticos http://www.sfs.uni­

tuebingen.de/hpsg/Talana­Lattice Laboratorio Generación de textos Paris, Francia

Interacción sintaxis­semántica http://talana.linguist.jussieu.fr/Modelos sintácticosModelos semánticos

Assticcot­IRIT­Toulouse Laboratorio Recursos terminológicos Toulouse, FranciaLingüística de corpus http://www.irit.fr/ASSTICCOT/Extracción de informaciónIngeniería del conocimiento

Laboratoire de LinguistiqueFormelle

Laboratorio Morfología y fonología Paris, Francia

Sintaxis y semántica formales http://www.llf.cnrs.fr/Entonación, pragmática y discurso

Instituto Universitario deLingüística Aplicada

Instituto Terminología Barcelona, España

Lexicografía http://www.iula.upf.es/Corpus especializadosRecursos terminoloógicosExtracción de informaciónLingüística computacional

Tabla 14: Centros de investigación en Europa

Nombre Categoría Área de Investigación LugarHPSG Stanford Group Grupo Recursos electrónicos para el inglés Stanford, USA

esu Gramática formal (HPSG) http://hpsg.stanford.edu/

Bases léxicas de conocimientos

Lexical­Functional GrammarGroup

Grupo Gramática léxico­funcional Stanford, USA

Teoría de la optimalidad http://www­lfg.stanford.edu/lfg/

Lógica linear e inferencia semántica

Computational Semantics Lab Laboratorio Mapeo de información Stanford, USA

Interfaces conversacionales http://www­csli.stanford.edu/semlab/

Interacción en lenguaje natural

Laboratory of Linguistics andComputation

Laboratorio Lexicón generativo Brandeis, USA

Resolución de anáforas y correferencia http://www.cs.brandeis.edu/~llc/

AIRG Harvard Laboratorio Lingüística computacional Harvard, USA

Modelos estadísticos para PLN http://www.eecs.harvard.edu/ai/

Discurso

Artificial Intelligence and NLP Grup Sistemas de diálogo Rochester, USA

Modelos del lenguaje http://www.cs.rochester.edu/dept/ainlkr/

Traductores automáticos

Interacción multi­modal

Parsing automático

Semántica del lenguaje natural

Spoken Language Systems Laboratorio Sistemas conversacionales MIT, Cambridge, USA

Procesamiento de voz http://www.sls.csail.mit.edu/sls/research/

Reconocimiento del habla

Generación del lenguaje

Natural Language Question­Answering

Laboratorio Inteligencia artificial MIT, Cambridge, USA

Lingüística computacional http://www.ai.mit.edu/projects/infolab/

Interfaces hombre­máquina

Language and ComputationLab

Laboratorio Tree­Adjoining Grammar Pensilvania, USA

Modelos estadísticos http://www.cis.upenn.edu/~linc/home.html

Herramientas de análisis lingüístico

Parsing automático

Desambigüación de palabras

Aprendizaje máquina

Extracción de información

Tabla 15: Grupos de investigación en E.U.A.

APÉNDICE E

EVENTOS

A continuación se   listan algunos eventos   (congresos,  simposios,  coloquios,   seminarios)relacionados con la ingeniería lingüística, tanto a nivel nacional como internacional. Deigual forma se da una lista de los eventos que tendrán lugar este año.

Simposio Iberoamericano de TerminologíaInternational Workshop on Computational TerminologyACL Coloquio de Lingüística en la Escuela Nacional de Antropología e HistoriaSemana de la informáticaEncuentro de Estudiantes de Literatura y Lingüística de la Universidad NacionalAutónoma de MéxicoSemana de Lingüística (UAM – I)Congreso Nacional de Lingüística (AMLA)Panel   on   Lexical   Markers   of   Common   Grounds  8th   International   PragmaticsConferenceTaller   regional   de   Recuperación   de   Información   y   Procesamiento   de   LenguajeNaturalSimposio Internacional de Comunicación SocialEncuentro Internacional de Lingüística en el NoroesteCongreso Latinoamericano de Multimedieros Universitarios The North American Symposium on Corpus LinguisticsConferencia Internacional CICLingCiclo de Conferencias Redes e InternetEncuentro Nacional de TerminologíaTaller Internacional de Procesamiento Computacional del Español y Tecnologíasdel LenguajeSimposio Internacional de Comunicación SocialJornadas Iberoamericanas de TerminologíaCongreso Internacional EURALEX Congreso Internacional ColingSituación actual y futuro de la ingeniería lingüística en MéxicoConferencia Internacional LRECSecond UK Special Interest Group for Computational LinguisticsAcademic Mini­ConferenceINTERCOCTA Workshop

Las próximas reuniones que se llevarán a cabo este año son: 

Nombre del evento Lugar WEB PageTAG+7 Vancouver, Canadá http://www.cs.rutgers.edu/TAG+7/

Intex/Nooj 2004 Tours, Francia http://tln.li.univ­tours.fr/JIntex2004/modele.html

NLDB2004 Salford, Manchester, Inglaterra http://www.nldb.org/

InSTIL/ICALL Symposium 2004  Venecia, Italia http://sisley.cgm.unive.it/ICALL2004/index.htmINLG04 New Forest, Inglaterra http://www.itri.brighton.ac.uk/inlg04/cfp.htm

CATALOG04 Barcelona, España http://www.upf.edu/dtf/personal/enricvallduvi/catalog04/LFG 2004 Christchurch, Nueva Zelanda http://www­lfg.stanford.edu/lfg/lfg2004/

ACL 2004 Barcelona, España http://www.acl2004.org/MCLI Colloquium Bloomintong, Indiana http://jones.ling.indiana.edu/~mclc/EMNLP 2004 Barcelona, España http://www.cs.ualberta.ca/~lindek/emnlp04/IR for QA Sheffield, EnglandCOLING 2004 Ginebra, Suiza http://www.issco.unige.ch/coling2004/ESSLLI 2004 Nancy, Francia http://esslli2004.loria.fr/give­page.php?1"Cognitive Modeling in Linguistics­04" Varna, Bulgaria http://www.cml.misis.ru/index.html?navi=mainAISC 2004 Hagenberg, Austria http://www.risc.uni­linz.ac.at/conferences/aisc2004/NCPW 2004 Plymonth, England http://www.tech.plym.ac.uk/socce/ncpw9/IWHLT 2004 Hong­Kong http://web.hku.hk/~hlt2004/IMCI 2004 Penn State University, Pensilvania http://www.icmiplace.org/ICGI 2004 Atenas, Grecia http://www.iit.demokritos.gr/icgi04/EKAW 2004 Northamptonshire, Gran Bretaña http://kmi.open.ac.uk/people/victoria/ekaw/EsTAL 2004 Alicante, España http://gplsi.dlsi.ua.es/congresos/estal04/WORM 2004 Lacarna, Chipre http://www.starlab.vub.ac.be/staff/mustafa/WORM_2004.htmICDM 2004 Brigthon, Gran Bretaña http://icdm04.cs.uni­dortmund.de/VIII EILN 2004 Hermosillo, Sonora, México http://www.8encuentro.uson.mx/default1.htmFOIS 2004 Torino, Italia http://fois2004.di.unito.it/index.html

Tabla 16: Eventos relacionados con la ingeniería lingüística a realizarse en el año 2004

APÉNDICE F

PROYECTOS

A continuación se enumeran los índices de los proyectos en los que el GIL ha participado,además, se da una liga a los documentos completos de cada proyecto para que se tenga unavisión global de cada uno de ellos. 

1. Corpus en ingeniería1.1 Constitución del corpus

1.1.1 Obtención de textos1.1.2 Delimitación de las áreas de ingeniería1.1.3 Identificación de fuentes1.1.4 Registro de información1.1.5 Solicitud de autorías1.1.6 Cartas de presentación1.1.7 Búsqueda de textos

1.2 Digitalización1.2.1 Escaneado en PDF imagen1.2.2 Escaneado en formato OmniPage1.2.3 Escaneado en formato texto1.2.4 Análisis de limpieza óptima del texto1.2.5 Limpieza del texto1.2.6 Salvado del archivo en texto

1.3 Etiquetado1.3.1 Estudio de etiquetado

1.3.1.1 Normalización de etiquetado (EAGLES, TEI)1.3.2 Lenguaje XML1.3.3 Análisis de etiquetas de corpus internacionales (UPF, BNC)

1.4 Definición de etiquetas para documentos1.4.1 Análisis bibliográfico de los textos1.4.2 Definición de elementos bibliográficos de los textos1.4.3 Identificación de etiquetas

1.5 Definición de etiquetas para el contenido1.5.1 Análisis de textos1.5.2 Consulta de requerimientos para el GIL1.5.3 Identificación de etiquetas

1.6 Elaborar un editor de textos para etiquetado 1.6.1 Buscar un editor1.6.2 Adaptar el editor

1.7 Etiquetado de los textos1.7.1 Marcaje semiautomático1.7.2 Marcaje automático

1.7.3 Parsing para revisión1.7.4 Cabecera del documento

1.8 Almacenamiento de textos en el corpus1.9 Administración

1.9.1 Registro  de  información sobre contactos,   fuentes,  áreas,  textos,  controlde préstamos1.9.2 Seguimiento de textos obtenidos y búsqueda de faltantes1.9.3 Registro de avance en digitalización de textos1.9.4 Creación de la página WEB del corpus1.9.5 Registro de textos ya etiquetados y difusión1.10 Herramientas de análisis1.10.1 Conteo de tokens y de palabras1.10.2 Índice de palabras alfabético y por frecuencias1.10.3 Concordancias

2. Extracción terminológica2.1 Estudio de métodos de extracción

2.1.1 Búsqueda de bibliografía2.1.2 Búsqueda en Internet

2.2 Búsqueda de extractores (UPF)2.3 Obtención, análisis y selección de extractores2.4 Extracción de términos

2.4.1 Obtención del corpus2.4.2 Extracción manual2.4.3 Extracción automática2.4.4 Evaluación

3. Extracción conceptual3.1 Banco de contextos definitorios

3.1.1 Base de datos de contextos definitorios3.1.2 Captura de contextos definitorios3.1.3 Marcaje de elementos de los contextos definitorios

3.2 Estudio de contextos definitorios3.2.1 Predicaciones pragmáticas (definición de patrones de formación)3.2.3 Predicaciones verbales (definición de patrones sintácticos y semánticos)3.2.4 Definiciones (estudio de las estructuras sintácticas)3.2.5 Relación entre los elementos de los contextos definitorios

3.2.5.1 Relaciones entre predicaciones verbales y tipos de definición3.2.5.2 Relaciones anafóricas entre términos y definiciones

3.2.6 Búsqueda de bibliografía relacionada3.3 Expansión del paradigma de  los elementos constitutivos

3.3.1 Expansión del paradigma verbal3.3.2 Expansión del paradigma pragmático 

3.4 Etiquetado de las partes de la oración3.5 Etiquetado de las estructuras sintácticas3.6 Etiquetado tipográfico3.7 Motor de búsqueda

3.7.1 Definir modelos de búsqueda3.7.2 Diseño del motor de búsqueda

3.8 Extracción de contextos definitorios3.8.1 Definir reglas y restricciones3.8.2 Realizar búsquedas 3.8.3 Obtención de resultados3.8.4 Evaluación (Precision & Recall)3.8.5 Redefinición de reglas y restricciones

4. Banco terminológico4.1 Diseño del banco

4.1.1 Compatibilidad con otros bancos en el mundo4.1.2 Información del banco

4.1.2.1 Presentación del banco4.1.2.2 Créditos4.1.2.3 Estadísticas de usuarios4.1.2.4 Estadísticas de volumen de información

4.2 Normalización de etiquetado (EAGLES, TEI)4.2.1 Lenguaje XML4.2.2 Análisis de etiquetas de corpus internacionales (UPF, BNC)

4.3 Funcionalidad del banco4.3.1 Interfaz del usuario4.3.2 Asignación de cuentas4.3.3 Ayuda

4.4 Captura de información4.4.1 Captura de datos terminológicos4.4.2 Revisión terminológica de las bases de datos 

4.5 Transferencia de datos a otras bases y aplicaciones del GIL4.5.1 Base de datos de contextos definitorios4.5.2 Determinación de paradigmas semánticos4.5.3 Determinación de palabras clave4.5.4 Formulaciones (queries) específicas

4.6 Control de usuarios4.6.1 Control de cuentas4.6.2 Control de captura por usuario

4.7 Respaldo del banco4.8 Transferencia de datos con otros bancos mundiales

4.8.1 GDT­OLF, Québec4.8.2 IULA, Barcelona4.8.3 RITerm

5. Paradigmas semánticos5.1 Estructura externa de conceptos

5.1.1 Estudio de estructura externa de conceptos 5.1.1.1 Consideraciones terminológicas5.1.1.2 Ontologías y tesauros5.1.1.3 WordNet

5.2 Obtención de la estructura conceptual de terminologías5.2.1 Obtención a partir de definiciones léxicas5.2.2 Obtención a partir de WordNet

5.3 Determinación de campos semánticos5.3.1 Integración de una terminología5.3.2 Diferenciación por campos

5.4 Estructura interna de conceptos5.4.1 Estudio de estructura interna de conceptos 5.4.2 Identificación de rasgos distintivos por campos semánticos5.4.3 Comparación entre definiciones del mismo término5.4.4 Comparación entre términos del campo5.4.5 Comparación con otros campos

5.5 Obtención de palabras clave5.5.1 Extracción de las definiciones5.5.2 Asignación intuitiva5.5.3 Extracción de diccionarios de sinónimos

5.6 Agrupación de palabras clave en paradigmas semánticos5.7 Algoritmo de paradigmas mediante alineamiento de definiciones

5.7.1 Mejoras al algoritmo5.7.1.1 Experimentación de variantes del algoritmo

5.7.2 Implementación del algoritmo Sierra­McNaught­Castillo5.7.2.1 Revisión al programa de McNaught

5.8 Base de paradigmas semánticos5.8.1 Determinación automática de pares semánticos5.8.2 Integración de base de conocimientos de paradigmas semánticos

6. Diccionario prototipo onomasiológico6.1 Motor de búsqueda6.2 Bases de datos

6.2.1 Palabras clave­ID palabras clave6.2.2 ID palabras clave­ID paradigmas6.2.3 Paradigmas­ID paradigmas6.2.4 ID paradigmas­ID términos6.2.5 ID términos­Términos­Definición

6.3 Interfaz6.4 Pruebas de retroalimentación6.5 Diccionario semasiológico

6.5.1 Corrector ortográfico6.5.2 Interfaz6.5.3 Pruebas de retroalimentación

7. Diccionario integral7.1 Integración de ambos diccionarios7.2 Inclusión de nuevos tipos de búsqueda7.3 Interfaz7.4 Pruebas de retroalimentación

8. Diccionario de lingüística8.1 Utilizar la terminología recopilada en el área de lingüística y presentarla comoun diccionario semasiológico electrónico, en donde se incluyan, por cada término: elárea, la definición, ejemplos, la tipología, etc.

8.1.1 Capturar las fichas documentales en forma electrónica.8.1.2 Codificar el artículo lexicográfico conforme a cada uno de los campos quelo integran.8.1.3 Diseñar el diccionario semasiológico electrónico e integrar la informacióncodificada.8.1.4 Elaborar el programa de hipertextos.

8.2 Buscar la agilización de la recopilación de términos y definiciones mediante laidentificación de operadores metalingüísticos explícitos en los textos especializados.

8.2.1 Encontrar un patrón aceptable de operadores metalingüísticos explícitosque puedan ser utilizados para la identificación de términos y definiciones entextos especializados, tales como páginas de Internet y documentos electrónicos.8.2.2  Hacer  un  fichero   terminológico que   incluya  el   contexto  de  donde sonextraídos   los   términos   y   definiciones,   y   que   identifique   los   operadoresmetalingüísticos que permitan inferir el concepto.

8.3 Determinar la estructura externa de los conceptos, es decir, la red ontológica ointerrelación entre los conceptos, que permita organizar los resultados de salida anteuna búsqueda onomasiológica. 

8.3.1 Analizar los textos especializados en lingüística con el fin de encontrar laestructura externa conceptual de la terminología.8.3.2   Considerar   que   la   descripción   de   los   conceptos   incluya   la   estructuraconceptual, esto es, su relación con los otros conceptos.

8.4 Definir la estructura interna con base en los conceptos redefinidos que incluyanla interrelación con otros conceptos. La estructura interna es la determinación de losparadigmas   semánticos   que   conforman   cada   concepto   y   permite   expandirautomáticamente la formulación inicial del usuario.

8.4.1 Modificar el algoritmo para determinar paradigmas semánticos en español.En el proyecto doctoral, el algoritmo fue aplicado a una terminología en inglés,con programas existentes adecuados a dicho idioma, lo que hace necesario quese tenga que desarrollar o verificar para el español.8.4.2 Validar el algoritmo mediante su aplicación a una terminología diferente,con un mayor número de términos, ya que en el proyecto doctoral se aplicó a unreducido número de términos y en un campo más específico.8.4.3   Evaluar   los   paradigmas   con   base   en   la   distancia   conceptual   en   EuroWordNet para español.

8.5  Elaborar  el   sistema  integral  de  consulta   semasiológica y onomasiológica  detérminos de lingüística.

8.5.1  Revisar la arquitectura existente del sistema de consulta onomasiológicaen donde se incluye la interfaz del terminólogo y la del usuario, así como la baseléxica de conocimientos conformada por los paradigmas semánticos.8.5.2   Diseñar   y   elaborar   el   programa   para   identificar   automáticamente   losparadigmas   que   corresponden   a   cada   concepto,   mediante   la   lectura   de   laspalabras clave que contienen.8.5.3   Programar   el   sistema   de   búsqueda   onomasiológica,   mediante   laformulación   en   lenguaje   natural,   es   decir,   enunciados   completos   más   quepalabras clave.8.5.4 Analizar los resultados de salida y ordenarlos jerárquicamente a través dela estructura externa conceptual.

9. Proyecto ILEXPrimer año:

9.1   Investigar   tanto   las   características   típicas   de   multimedia   e   ingeniería   desoftware,   así   como   las   herramientas   tecnológicas   de  procesamiento  de   lenguajenatural y de recuperación de información.9.2 Revisar y evaluar  las ventajas y desventajas de los  diccionarios  electrónicosdisponibles en el mundo.9.3  Determinar  los   recursos  computacionales  que mejor   servirán como vehículopara realizar búsquedas inteligentes, tanto semasiológicas como onomasiológicas.9.4 Identificar los métodos para presentar de la mejor manera los materiales queconstituyen el diccionario. 9.5 Seleccionar las mejores características y herramientas encontradas como basepara el diseño del diccionario electrónico, a partir de la información obtenida.

Segundo año:9.6 Diseñar la interfaz del diccionario electrónico que satisfaga las necesidades yrequerimientos   de   los   usuarios   y   cumpliendo   con   los   criterios   de  amigabilidad,accesibilidad y economía.9.7 Desarrollar la  interfaz con la ayuda del algún lenguaje de programación queproporcione   portabilidad,   compatibilidad   y   migración   entre   diferentes   sistemasoperativos.9.8 Construir motores inteligentes de búsqueda con PLN.9.9 Incorporar los aspectos de multimedios que harán más atractivo al diccionarioelectrónico.9.10   Diseñar   una   estructura   modular   del   ILEX  que   permita   el   crecimiento   deldiccionario sin la necesidad de modificar la interfaz.9.11   Alimentar   al   diccionario   electrónico   con   las   fichas   terminológicas(especialmente términos y definiciones) de alguno de los varios diccionarios quetenemos a disposición. 

Tercer año:9.12 Diseñar plan de pruebas para detectar errores.9.13 Ejecutar plan de pruebas.9.14 Analizar los resultados de las pruebas.9.15 Corregir errores y ajustar interfaz.9.16 Diseñar plan de mantenimiento.

10. Diccionario de sexualidad10.1 Sistematizar la terminología en torno a la sexualidad.

10.1.1 Construir un corpus de sexualidad.10.1.2 Construir un sistema conceptual.10.1.3   Identificar   los   términos   y   sus   sinónimos   que   se   incluirán   en   eldiccionario.10.1.4 Construir base de datos.10.1.5   Redactar   definiciones   entendibles   por   la   población   en   general   /terminólogos y sexólogos / ilustrar los términos.10.1.6 Validar el diccionario ante expertos y con grupos focales.

10.2 Hacer accesible la información sobre sexualidad.10.2.1   Estructurar   didácticamente   los   conceptos   e   ilustraciones   adecuado   alpúblico.10.2.2 Validar con grupos focales el diccionario.10.2.3 Diseñar y elaborar un diccionario electrónico con interfaz inteligente.10.2.4 Promover el diseño y la elaboración de un diccionario de sexualidad enlínea.10.2.5 Promover la edición en papel del diccionario de sexualidad.10.2.6 Promocionar el diccionario de sexualidad entre:

a) Expertos en sexualidad,b) Comunicadores,c) Tomadores de decisiones, d) Público meta.

10.2.7 Elaborar estrategia de distribución.

10.3 Construir el vehículo computacional de sustento para el diccionario.10.3.1Construir el corpus.10.3.2 Construir el banco terminológico.10.3.3 Adquirir el software de extracción terminológica.10.3.4 Desarrollar el diccionario.10.3.5 Realizar pruebas al diccionario.

10.4 Fortalecer un equipo multidisciplinario para la elaboración de un diccionariode sexualidad. El equipo de trabajo estará conformado por profesionistas en diseñográfico, ilustradores, pedagogos, sexólogos, terminólogos, computólogos.

10.4.1   Establecer   acuerdos   formales   de   participación   entre   las   institucionesimpulsoras del proyecto.10.4.2 Conformar equipo de informáticos, diseñadores, terminólogos, sexólogose ilustradores.10.4.3 Sensibilizar en sexualidad y en terminología.10.4.4 Generar un sistema de incentivos.

10.4.5 Promover reuniones de intercambio y convivencia. (grupos de discusión)

10.5 Movilizar recursos.10.5.1 Elaborar propuesta ganadora.10.5.2 Buscar patrocinios blandos.10.5.3 Conseguir patrocinadores internacionales y nacionales.10.5.4 Promover que el proyecto sea auto­sustentable.

APÉNDICE G

BECARIOS 

A   continuación   se   presenta   una   relación,   así   como   una   pequeña   descripción   de   lasactividades   de   los   integrantes   del   GIL,   que   actualmente   disfrutan   de   una   beca   oremuneración económica.

• Técnicos Académicos

Gabriel Castillo Hernández. Maestro en Ingeniería y Ciencias de la Computación de laUNAM  (2002).   Técnico   Académico   del   Instituto,   quien   apoya   al   GIL  desde   el  2000,actualmente mantiene este apoyo en la coordinación de alumnos de cómputo. Asimismo,imparte cursos en la Facultad de Ingeniería de la UNAM.

• Becarios en el Nivel Post­Doctoral

Alfonso Medina Urrea. Doctor en Lingüística por parte de El Colegio de México en 2003.Fue incorporado al GIL como becario doctoral y posdoctoral desde 2002 y el 1º de junio de2003  como Investigador Posdoctoral por dos años. Está dirigiendo una parte del proyectode   CONACYT   (recopilación   de   documentos,   organización   y   análisis   del   CorpusLingüístico   de   Ingeniería),   a   la   vez   que   está   desarrollando   sus   propias   líneas   deinvestigación, especialmente en el área de morfología computacional. Para ello, supervisalas actividades de algunos alumnos. Ha impartido cursos en la UNAM en la Facultad deIngeniería, así como en el Posgrado de Lingüística. Como becario Post­doctoral, tuvo unaestancia de investigación de diez días en el Centro de Lingüística Aplicada, Santiago deCuba, para conocer un analizador sintáctico probabilístico y su posible uso en los proyectosdel   GIL.   Su   estancia   fue   patrocinada   por   el   proyecto   CONACYT.   Igualmente,   hapresentado trabajos en distintos foros nacionales e internacionales sobre corpus lingüístico,morfología   de   lenguas   indígenas,   así   como   diseño   de   un   diccionario   electrónico   desexualidad.

• Profesores invitados

Carlos Rodríguez Penagos. Estudiante al nivel Doctoral de la Universidad Pompeu Fabra.Se incorporó al GIL como profesor invitado desde agosto del 2003 a diciembre de 2004. Haimpartido   un   curso   de   programación   para   lenguaje   natural   (véase

http://iling.torreingenieria.unam.mx/cursoPLN/default.htm), de interés general para el GIL.Trabaja en un proyecto conjunto de extracción de información conceptual.  Actualmenteestá encargado de la búsqueda de nuevos proyectos. En este año, presentará avances de suinvestigación   y   colaboración  con   el   GIL  en   foros   de   Estados   Unidos   y   Europa   sobrelingüística computacional y terminología.

• Becarios académicos

Carlos Méndez Cruz. Becario académico con Licenciatura en informática y estudiando losprerrequisitos   para   la   maestría   en   Lingüística   Hispánicas.   Imparte   cursos   de   diseño  yadministración de bases de datos en  la  Facultad de Contaduría y Administración de  laUNAM. Se encuentra a cargo del mantenimiento de la red de cómputo del GIL, así comodel diseño de la página WEB, a través de cinco estudiantes de licenciatura en informática,que realizan su servicio social.

• Becarios doctorales

César Antonio Aguilar. Maestro en Lingüística por parte del Posgrado en Lingüística en2003.   Incorporado   al   GIL   desde   febrero   del   2002,   ha   desempeñado   labores   para   laorganización y administración de becarios de este Grupo, así como colaboraciones en elanálisis   lingüístico en contextos  definitorios.  A partir de esta colaboración, presentó  unproyecto de investigación al nivel Doctoral en el Posgrado de Lingüística de la UNAM, elcual fue aceptado en agosto del 2003. Tal proyecto va dirigido a hacer una descripción depatrones sintácticos, semánticos y discursivos localizados en definiciones dentro de textosde especialidad. Tal investigación ha contado con las colaboraciones de Rodrigo Alarcón, yde Carlos Rodríguez Penagos. Fruto de dicha colaboración será la presentación de algunostrabajos en foros de lingüística y terminología nacionales y extranjeros durante este año.

Rodrigo Alarcón Martínez. Licenciado en Letras Hispánicas por parte de la Facultad deFilosofía y Letras de la UNAM, integrado al GIL desde el 2000. Elaboró una tesis sobre elanálisis de patrones lingüísticos localizados en contextos definitorios en español, la cual hafundado una línea de investigación de suma importancia para el GIL: el reconocimiento yanálisis   de   contextos   definitorios   en   español.   La   documentación   de   este   estudio   estáplasmada en varias presentaciones en Congresos nacionales e internacionales,  así como enartículos   publicados   en   revistas   especializadas.   En   agosto   del   2003   fue   aceptada   sucandidatura para cursar el Doctorado en Lingüística Aplicada en el Instituto de LingüísticaAplicada de la Universitat Pompeu Fabra (Barcelona, España). Hoy en día, mantiene unacolaboración constante con el GIL, específicamente en el análisis lingüístico de contextosdefinitorios y representación de conceptos en textos de especialidad.    

• Becarios de Maestría

Marlene Moreno del Pilar. Licenciada en Ingeniería de la Computación por parte de laUNAM, integrada al GIL desde 2002. Ha hecho trabajos de diseño de interfaces, así comola instalación y administración de servidor UNIX para el Corpus Lingüístico de Ingeniería.Realizó su tesis de licenciatura con la asesoría de Gabriel Castillo, obteniendo el título en2003. Durante este periodo, con Gabriel Garduño realizaron una estancia de IntercambioAcadémico   de   tres   meses   en   el   Instituto   Universitario   de   Lingüística   Aplicada   de   laUniversidad Pompeu Fabra (UPF),  donde  tomaron  tres  cursos a  nivel  de doctorado, seintegraron   al   Proyecto  del   Corpus  de   la   UPF  y  desarrollaron  una   herramienta  para   elpreprocesamiento de  los   textos  del mismo proyecto. Dicha estancia  tuvo patrocinio delProyecto CONACYT, de la DGEP y de la UPF. En la actualidad, cursa el 3er semestre de laMaestría en Ingeniería y Ciencias de la Computación del IIMAS, con miras a realizar unainvestigación para el diseño de los diccionarios electrónicos del GIL. Por ello, se encuentraa cargo del área de desarrollo de Diccionarios Electrónicos, para lo cual coordina a variosestudiantes de licenciatura en cómputo y lingüística. Igualmente, imparte un curso en laFacultad de Ingeniería de la UNAM.

Gabriel Garduño Torres. Licenciado en Ingeniería en Computación, cursa actualmente el3er semestre de la Maestría en Ingeniería y Ciencias de la Computación del IIMAS­UNAM.Inició sus labores dentro del GIL como Servidor Social en 2001, posteriormente realizó untrabajo en el diseño y administración del Banco Terminológico (véase  la  página WEB:http://iling.torreingenieria.unam.mx/diccionarios/),   con   el   cual   obtuvo   su   grado   deLicenciado   en   Ingeniería   en   Cómputo   en   el   2003.   Su   labor   dentro   del   Grupo   se   haconcentrado   en   el   diseño   y   administración   del   Banco  Terminológico,   así   como   en   laplaneación de interfaces para diccionarios electrónicos en Lingüística y Sexualidad. Juntocon Marlene Moreno realizó una estancia de Intercambio Académico de tres meses en elInstituto Universitario de Lingüística Aplicada (IULA) de la Universidad Pompeu Fabra,participando en tres cursos a nivel de doctorado, e integrándose también al Proyecto delCorpus   de   la   UPF,   específicamente   en   la   elaboración   de   una   herramienta   para   elpreprocesamiento de los textos del mismo proyecto. Tal estancia hizo efectivo un acuerdode colaboración  e intercambio de estudiantes entre el Instituto de Ingeniería de la UNAMcon el IULA, lo que ha ayudado a reforzar la proyección del GIL a nivel internacional.Sumado a sus actividades como estudiante de Maestría, hoy en día está a cargo del área deinvestigación dedicada al desarrollo del Banco Terminológico.

Antonio Reyes Pérez.  Estudiante de la Maestría en Lingüística Hispánica de la UNAM,desempeña labores en el GIL desde el 1º de octubre del 2000. Ha sido Servidor Social,becario al nivel de tesis de licenciatura (patrocinado por DGAPA y CONACYT), y en laactualidad becario de estudios de Posgrado (patrocinado por CONACYT). Su trabajo se hadirigido al análisis lingüístico de información para la obtención de paradigmas semánticospara los diccionarios de física y lingüística, usando la herramienta Word­Smith, así como laimplementación de redes semánticas en textos de especialidad. Se encuentra a cargo del

área de investigación en Bases de Conocimientos Léxicos, la cual se deriva de sus estudiosen Licenciatura y Maestría. El resultado de sus análisis se ha presentado en ponencias yartículos publicados en foros nacionales y extranjeros desde el 2002 hasta la fecha.

• Becarios de Licenciatura

Antonia Estrada Trejo.  Pasante de la carrera de Letras Hispánicas (con especialidad enLingüística) por parte de la UNAM. Ingresó al GIL en agosto del 2001 como becaria deestudios   en   el   nivel   de   licenciatura,   dedicada   a   la   revisión   lexicográfica   del   bancoterminológico,   así   como al   reconocimiento  de  patrones   tipográficos  y   sintácticos  en  eldiccionario onomasiológico de lingüística. Posteriormente, ha desarrollado un proyecto detesis  de licenciatura enfocado hacia el análisis de relaciones conceptuales empleando elsistema de cómputo WordNet. Igualmente, colabora en el proceso de selección y escaneadode textos para el Corpus Lingüístico.

Carla Márquez González. Pasante de la carrera de Letras Hispánicas (con especialidad enLingüística) de la Facultad de Filosofía y Letras de la  UNAM. Se incorporó al GIL en2001, realizando trabajos de análisis para la determinación de palabras claves para consultasonomasiológicas, así como escaneo de textos de especialidad para el Corpus Lingüístico deIngeniería. Concluyó tales labores en 2002. Desde 2003 hasta la fecha, colabora con el GILde manera externa en una investigación sobre el  uso de paradigmas semánticos para larealización de búsquedas onomasiológicas (en colaboración con otros estudiantes de lasáreas de cómputo y lingüística), con miras a realizar su tesis de licenciatura.

Martha   Grizel   Delgado   Rodríguez.   Becaria   de   licenciatura   en   Letras   Hispánicas(lingüística) desde el 1º de julio del 2002, colabora dentro del GIL en la digitalización detextos para el Corpus Lingüístico en Ingeniería. Realizó una estancia de trabajo en el VIIPrograma de la Investigación Científica, patrocinado por la AMC (julio­agosto del 2003),en  el  Centro de   Investigación en  Cómputo  del   Instituto  Politécnico  Nacional,    bajo   laasesoría del   Dr. Alexander Gelbukh, jefe del Laboratorio de Procesamiento de LenguajeNatural. En la actualidad, elabora su tema de investigación para tesis de licenciatura encuestiones de conceptualización desde un enfoque onomasiológico, colaborando con otrosestudiantes de cómputo y lingüística en las áreas de Diccionarios Electrónicos (a cargo deMarlene Moreno) y Base de Conocimientos Léxica (supervisada por Antonio Reyes).

Carlos Fonseca Rojas.  Estudiante de  la  carrera en Ingeniera de  la  Computación de  laUNAM, ingresó al GIL en junio del 2002, dándose de alta posteriormente como servidorsocial el 1º de septiembre del 2003. Ha hecho actividades de digitalización de textos para elCorpus Lingüístico de Ingeniería, así como la integración de sinónimos al Diccionario deLingüística.   En   la   actualidad,   realiza   labores   de   apoyo   en   cómputo  para   las  áreas   deDiccionarios Electrónicos y Base de Conocimientos Léxicos, así como delimitación de unproyecto de tesis de licenciatura (en proceso).

Brenda Torres Castillo.  Estudiante de la carrera en Ingeniera de la Computación de laUNAM.  Se   incorporó   al   GIL  el   1º   de   septiembre  del  2002   como becaria   al   nivel   delicenciatura, bajo la coordinación de Gabriel Castillo. Ha desempeñado labores tales comola   digitalización   de   documentos   para   el   Corpus   Lingüístico,   así   como   apoyo   para   laobtención   de   documentos   electrónicos   especializados   en   Ingeniería.   En   la   actualidad,colabora   en   el   desarrollo   de   un   prototipo   para   el   Diccionario   Onomasiológico   enLingüística, asesorada tanto por Castillo como por Marlene Moreno.

Jessica Alejandra Méndez. Se integró al GIL el 1º de septiembre del 2002, como becariaal nivel de licenciatura. Es estudiante de la carrera en Ingeniería de la Computación porparte de la UNAM. Ha participado en la  creación de   una interfaz para un diccionario deSexualidad,   así   como   en   el  desarrollo   de   sistemas   para   la   creación   de   DiccionariosOnomasiológicos, bajo la dirección de Gabriel Castillo. En la actualidad, colabora en ladigitalización de textos para el Corpus Lingüístico. Contando con la asesoría de MarleneMoreno, formará parte de un proyecto de tesis colectiva entre estudiantes de cómputo ylingüística para el desarrollo de diccionarios electrónicos.

Nadia Buendía Silva. Desempeña labores dentro del GIL desde septiembre del 2002 bajola dirección de Gabriel Castillo. Se dio de alta como becaria al nivel de licenciatura el 1º demarzo del 2003. Participa en la digitalización de documentos para el Corpus de Ingeniería,y junto con Jessica Alejandra Méndez, se integrará a un proyecto de tesis colectiva para eldesarrollo de diccionarios electrónicos, coordinada por Marlene Moreno.

Eduardo Solares Martínez. Ingresó al GIL como becario al nivel de licenciatura el 1º deseptiembre del 2002 para trabajar en el etiquetado de palabras del diccionario de lingüística,así  como escaneo de textos de especialidad para el Corpus Lingüístico en Ingeniería. Apartir de esto,  ha colaborado en la selección y agrupamiento de palabras claves para elDiccionario de Física, en la implementación de un algoritmo para la agrupación de cabezasde paradigmas en JAVA, así como en la migración de sinónimos en WordNet en XML aMS­SQL. En este año comenzará la elaboración de su tema de tesis de licenciatura en eldesarrollo   de   una   interfaz   para   diccionarios   electrónicos,   en   colaboración   con   otrosestudiantes de cómputo y lingüística, bajo la asesoría de Marlene Moreno.

APÉNDICE H

GIL

A continuación se detalla el desarrollo del GIL a través de sus integrantes y del trabajo quehan realizado.

Becarios  Categoría Procedencia Nivel Área Ingreso

Adriana Miranda Nava Becario TL UNAM LicIng.Comp. 01­Sep­02

Antonia Estrada Trejo Becario TL UNAM Lic Letras His 01­Sep­01Antonio Reyes Pérez Becario M UNAM Ma Ling His 01­Sep­00

Brenda Torres Castillo Estudiante L UNAM LicIng.Comp. 01­Sep­02

Carla Márques González Becario TL UNAM Lic Letras His 01­Sep­01

Carlos Fonseca Rojas Estudiante L UNAM LicIng.Comp. 01­Sep­02

Carlos Méndez Cruz Becario Aca UNAM Lic Inform 01­May­03Carlos RodríguezPenagos Becario TD UPF Doc

LingAplid 01­Ago­03

César A. Aguilar Becario D UNAM Doc Ling His 01­Mar­02Eduardo SolaresMartínez Becario TL UNAM Lic

Ing.Comp. 28­Abr­03

Enrique Romero García SS UNAM LicIng.Comp. 23­Mar­04

Fabricio Jocabad Vallejo SS UNAM Lic Inform 01­Mar­04Grizel DelgadoRodríguez Becario TL UNAM

Bach. Letras His 01­Jun­02

Gabriel Garduño Torres Becario M UNAM MaIng.Comp. 01­Mar­01

Itzia Baca Ibarra SS UNAM Lic Filosof 21­Nov­03

Jessica Méndez Liceaga Becario TL UNAM LicIng.Comp. 01­Sep­02

Luis Daniel Escobar SS ENAH Lic Ling 14­Oct­03Mariano NavarroMorales Estudiante L UNAM Lic

Ing.Comp. 28­Abr­03

Marlene Moreno del Pilar Becario M UNAM MaIng.Comp. 01­Mar­02

Nadia Buendia Silva Becario TL UNAM LicIng.Comp. 01­Mar­04

Paulina Sánchez AguilarEstudianteTL UNAM Lic Inform 01­Sep­02

Rodrigo Alarcón Becario D UPF DocLingAplid 01­Ago­00

Roberto Saldaña SS UNAM LicIng.Comp. 01­Mar­04

Roberto Rodríguez SS UNAM Lic Inform 01­Sep­03Sonia Elisa Morett Estudiante  UNAM Lic Letras His 01­Mar­04

Tabla 17: Relación de los miembros actuales del GIL

Becarios que hanterminado Categoría Procedencia

Nivel Área Ingreso Término

Becarios PasadosClaudia Colomer Becario Aca UNAM Lic Letras His 01­Ago­00 31­Jul­02

Claudia I. Vázques Becario L BUAP Lic Letras His 28­Jun­0327­Ago­03

Gabriela Muñoz Becario L UNAM Lic Letras His 01­Ago­00 31­Jul­01

Héctor Ortíz  SS UNAM LicIng.Comp. 16­Abr­02

16­Ago­02

Juan C. Dávila SS UNAM Lic Inform 14­Nov­0314­May­04

Karla I. Ortega Becario TL UNAM Lic Inform 19­Mar­0131­Dic­02

José L. Godines SS UNAM Lic Inform 01­Sep­0329­Feb­04

Luisa Callejas SS UNAM LicIng.Comp. 08­Sep­03

29­Feb­04

Miguel A. Valdés Becario L UNAM LicIng.Comp. 01­Abr­01

31­Ago­01

Myriam Redonda Becario L UNAM LicIng.Comp. 01­Abr­01

31­Ago­01

Norma Alarcón Becario L UNAM LicIng.Comp. 01­Oct­00

30­Sep­01

Ramón Z. Ponce de León Becario L UNAM Lic Letras His 01­Ago­01 31­Jul­02

Raúl Montiel Romero SS UNAM Lic Inform 14­Nov­0314­May­04

Roy Elineema Becario M UNAM MaIng.Comp. 01­Ago­00 31­Jul­01

Sofía Kamenetskaia Becario Aca UNAM Ma Ling His 01­Ago­00 31­Jul­01

Úrsula Sánchez Becario L UNAM LicPsicología 01­Jul­02

31­Ago­02

Verónica ChávezMedonza Becario L UNAM Lic

Ing.Comp. 01­Abr­01

28­Feb­02

Xochitl López Becario L UNAM LicIng.Comp. 01­Mar­02

31­Ago­02

Tabla 18: Relación de becarios que trabajaron en el GIL

Académicos:

Nombre Categoría Procedencia Nivel Área

Gerardo Sierra MartínezInv. Asoc.C UNAM Doc

LingComp

Alfonso Medina UrreaInv.Posdoc. COLMEX Doc Ling Hisp

Gabriel CastilloHernández Tec. Acad. UNAM Ma Ing CompCarlos Méndez Cruz Académico UNAM Lic Inform

Tabla 19: Miembros académicos del GIL

Participación en el GIL:

Becarios Actividad Área Puesto

Jefe deárea /

Coordinador

Adriana Miranda Nava Variación léxica ParSem Estudiante

M. en C.GabrielCastillo

Antonia Estrada Trejo Evaluación de WordNet BCL EstudianteLic. AntonioReyes

Antonio Reyes Pérez Rel. Léxicas, sem y pragm BCL Jefe de áreaLic. AntonioReyes

Brenda Torres Castillo Variación léxica ParSem  Estudiante

M. en C.GabrielCastillo

Carla Márques González Dicc Elec EstudianteIng. MarleneMoreno

Carlos Fonseca Rojas Digitalización ConstCLI / BCL Estudiante

Dr. AlfonsoMedina / Lic.AntonioReyes

Carlos Méndez Cruz No definido Cómp AcadémicoLic. CarlosMéndez

Carlos Rodríguez Penagos Operadores metalingüísticos CD's Coordinador

Mtro. CarlosRodríguezPenagos

César A. Aguilar Desc Ling Definiciones CD's / BCL Coordinador

Mtro. CésarA. Aguilar /Lic. AntonioReyes

Eduardo Solares Martínez Interfaces del Dicc Onomas Dicc Elec EstudianteIng. MarleneMoreno

Enrique Romero García Digitalización ConstCLI SSDr. AlfonsoMedina 

Erick Arrellano Casillas Admin. Cómp. Cómp. EstudianteLic. CarlosMéndez

Fabricio Jocabad Vallejo Página WEB No definido SSLic. CarlosMéndez

Grizel Delgado Rodríguez Conceptualización lingüística Dicc Elec / BCL Estudiante

Ing. MarleneMoreno / Lic.AntonioReyes

Gabriel Garduño Torres Búsqueda de términos BT / EtCLI Jefe de área

M. en C.GabrielCastillo

Itzia Baca Ibarra No definido ConstCLI SSDr. AlfonsoMedina

Jessica Méndez Liceaga Interfaces del Dicc Onomas Dicc Elec EstudianteIng. GabrielCastillo

Julieta Villaseca Bello Admin. Cómp. Cómp SSLic. CarlosMéndez

Luis Daniel Escobar No definido ConstCLI SSDr. AlfonsoMedina

Mariano Navarro Morales No definido No definido Estudiante No definido

Marlene Moreno del Pilar Desarrollo de dicc electrónicos Dicc Elec Jefa de áreaIng. MarleneMoreno

Nadia Buendia Silva Interfaces del Dicc Onomas Dicc Elec Estudiante

M. en C.GabrielCastillo

Paulina Sánchez Aguilar Sist de Inf Bibliográfica No definido EstudianteLic. CarlosMéndez

Roberto Saldaña Banco terminológico BT SSIng. GabrielGarduño

Roberto Rodríguez Administración del sistema No definido SSLic. CarlosMéndez

Sonia Elisa Morett No definido ConstCLI / BCL Estudiante

Dr. AlfonsoMedina / Lic.AntonioReyes

Tabla 20: Actividades y responsables del GIL

APÉNDICE I

DIFUSIÓN

En este apéndice se señalan los trabajos de investigación del GIL que se han presentado endistintos foros y en distintos medios como forma de difusión.

Congresos:

"Descripción de la noción concepto desde una perspectiva lingüístico­cognitiva para eldesarrollo de un diccionario onomasiológico."  Delgado G., Reyes A., Aguilar C. IX Simposio Iberoamericano de Terminología  "Estructuración de datos en bancos terminológicos para procesos de representación deconocimiento en sistemas de recuperación de información."  Reyes A., Solares E. IX Simposio Iberoamericano de Terminología 

"Procesamiento automático del metalenguaje en Terminología: Nuevas herramientas parala enseñanza y la investigación"  Carlos Rodríguez RITERM2004 IX Simposio Iberoamericano de Terminología “La Terminología en el SigloXXI: contribución a la cultura de la paz, la diversidad y la sostenibilidad”   "Metalinguistic Information Extraction for Terminology."  Carlos Rodriguez 3rd International Workshop on Computational Terminology (CompuTerm 2004)  

"Mining metalinguistic activity in corpora to create lexical resources using InformationExtraction techniques: the MOP system"  Carlos Rodríguez ACL 2004 Main Conference  "Comparación de densidades de disparadores de presuposiciones pragmáticas en el CorpusLingüístico de Ingeniería y el Corpus del Español Mexicano Conte"  Medina A., Reyes A., Delgado G. V Coloquio de Lingüística en la Escuela Nacional de Antropología e Historia.  "La Extracción de Información: un reto informático"  Méndez C. Semana de la informática 

"Preliminares del diccionario onomasiológico: hacia una metodología del diccionarioinverso"  Delgado, G. 1° Encuentro de Estudiantes de Literatura y Lingüística de la Universidad NacionalAutónoma de México 

"Modelos metalingüísticos en los procesos de recuperación de información."  Reyes, A. Encuentro de Estudiantes de Literatura y Lingüística de la Universidad NacionalAutónoma de México.  

"Patrones para una estructuración semántica de un diccionario onomasiológico. "  Reyes A. Tercera Semana de Lingüística (UAM – I) 

"Determinación de relaciones léxicas a partir de la co­ocurrencia en definiciones. "  Reyes A., Sierra G. VII Congreso Nacional de Lingüística (AMLA). 

"Researching research using metalinguistic information extraction: A common ground forknowledge through knowledge of language"  Carlos Rodríguez Panel on Lexical Markers of Common Grounds. 8th International Pragmatics Conference   "Ingeniería Lingüística de la UNAM"  Delgado, G. 1er. Taller regional de Recuperación de Información y Procesamiento de Lenguaje Natural 

"Segmentación estadística de vocablos del español: aplicación de la prueba deindependencia de x2 para descubrir afijos del español"  Medina A. VIII Simposio Internacional de Comunicación Social. 

"Banco terminológico para el Grupo de Ingeniería Lingüística"  Sierra G., Garduño G., Moreno M. VIII Simposio Internacional de Comunicación Social. 

"Análisis de predicaciones verbales en el Corpus de Referencia del Español Actual"  Sierra G., Alarcón R. VII Encuentro Internacional de Lingüística en el Noroeste.   "Métodos de segmentación automática (stemming) aplicados al sintagma verbal español"  Medina A., Delgado G. VII Encuentro Internacional de Lingüística en el Noroeste. 

  "Análisis de frecuencia de construcciones anafóricas en narraciones infantiles a partir delprograma CHILDES"  Aguilar C. VII Encuentro Internacional de Lingüística en el Noroeste. 

"Características cuantitativas de la morfología flexiva del chuj"  Medina A. VII Encuentro Internacional de Lingüística en el Noroeste.   "Diccionario básico de sexualidad"  Moreno M., Garduño G., Sierra G., Medina A., Casti Congreso Latinoamericano de Multimedieros Universitarios 2002.   "Corpus Annotation for Automatic Extraction of Definitions"  Sierra G., Medina A., Ortega K. The Fourth North American Symposium on Corpus Linguistics. 

"Hacia la extracción automática de conceptos"  Alarcón R., Sierra G. VIII Simposio Iberoamericano de Terminología. 

"Identification of recurrent patterns to extract definitory contexts"  Sierra G., Alarcón R. Conferencia Internacional CICLing­2002. 

"Patrones recurrentes para la introducción de conceptos en textos de ingeniería"  Sierra G., Alarcón R.  II Encuentro Internacional: "Lingüística Aplicada y Sociedad". 

"Lingüística Computacional "  Sierra G. I Ciclo de Conferencias Redes e Internet.  

"Terminología e Infomática "  Sierra G. I Encuentro Nacional de Terminología.  

"Taller: Recursos terminológicos en Internet "  Sierra G. I Encuentro Nacional de Terminología.    "Retos y oportunidades de la lingüística computacional "  Sierra G. 

Facultad de Matemáticas de la Universidad Autónoma de Yucatán.    "Extracción automática de términos de física a partir de textos especializados"  Sierra G., Reyes A.  VI Congreso Nacional de Lingüística Aplicada.  

"Desarrollo de la Ingeniería Lingüística en la UNAM, México"  Sierra G., Castillo G., Reyes A., Alarcón R. II Taller Internacional de Procesamiento Computacional del Español y Tecnologías delLenguaje.  

"Búsqueda de palabras a partir de las definiciones en los diccionarios de lenguaautomatizados"  Sierra G. VII Simposio Internacional de Comunicación Social. 

 "La informática en el trabajo terminológico"  Sierra G. II Jornadas Iberoamericanas de Terminología.  

"Terminología, Inteligencia Artificial e Ingeniería Lingüística"  Sierra G. II Jornadas Iberoamericanas de Terminología.  

"The onomasiological dictionary: a gap in lexicography "  Sierra G.  IX Congreso Internacional EURALEX 2000 

"Extracting semantic clusters from the alignment of definitions"  Sierra G., McNaught J. XVIII Congreso Internacional Coling­2000 

"Situación actual y futuro de la ingeniería lingüística en México"  Hayet M., Sierra G. Situación actual y futuro de la ingeniería lingüística en México   "Extraction of Semantic Clusters for Terminological Information Retrieval from MRD "  Sierra G., McNaught J. II Conferencia Internacional LREC­2000 

"Analogy ­ Based Method for Semantic Clustering "  Sierra G., McNauht J. Conferencia Internacional CICLing­2000  

"El diccionario de búsqueda onomasiológica: perspectivas de la lingüística computacional"Sierra G. V Congreso Nacional de Lingüística 

"Ingeniería Lingüística: retos y oportunidades"  Sierra G. Ingeniería Lingüística: retos y oportunidades   "Analogy­based semantic clustering for terminological information retrieval "  Sierra G. Second UK Special Interest Group for Computational Linguistics   "Avances en el desarrollo del Diccionario Electrónico de búsqueda Onomasiológica "  Sierra G. V Simposio Iberoamericano de Terminología   "A Concept­Oriented Dictionary for the Missing Word "  Sierra G. First Academic Mini­Conference 

"INTERCOCTA Workshop"  INTERCOCTA Workshop   "Estructura semántica del Léxico en un diccionario onomasiológico práctico "  Sierra G. III Congreso Nacional de Lingüística   "Bases del diccionario onomasiológico computarizado en el área de desastres "  Sierra G. IV Simposio Iberoamericano de Terminología   "Problemas en la búsqueda de términos en el área de desastres "  Sierra G. I Congreso Nacional de Lingüística: Las lenguas y su uso 

Tabla 21: Conferencias en las que ha participado el GIL

Artículos en Revistas:

Sierra G., McNaught J. "Natural Language System for Terminological Information Retrieval" En Lecture Notes in Computer Science (indizada por SCIE). Num.2588, Volumen , 2003.pp. 543­554 

Sierra G., Alarcón R. "Identification of recurrent patterns to extract definitory contexts " En Lecture Notes in Computer Science (indizada por SCIE). Num.2276, Volumen , 2002.436­438 

Sierra G., McNaught J., Castillo G. "Extracting semantically rich knowledge from alignment of definitions" En Computational Linguistics and Intelligent Text Processing. Num.1, Volumen 1, 2002.245­249 

Sierra G., McNaught J.,  "Extracting semantic clusters from MRD for an onomasiological search dictionary" En International Journal of Lexicography. Num.4, Volumen 13, 2000.    Sierra G., McNaught J. "Design of an onomasiological search system: A concept­oriented tool for terminology" En Terminology. Num.1, Volumen 6, 2000.  

Medina A. "Automatic Discovery of Affixes by means of a Corpus: A Catalog of Spanish Affixes" En Journal of Quantitative Linguistics. Num.2, Volumen 7, 2000.    Sierra G. "Estructura semántica del léxico en un diccionario onomasiológico práctico" En Estudios de Lingüística Aplicada. Num.23 y 24, Volumen , 1996.    Sierra G. "Outline of an Onomasiological Dictionary Software in the Disaster Area" En IITF Journal, Terminology Science & Research. Num.2, Volumen 6, 1995.  

Sierra G. "El diccionario de desastres del GIID: un informe de su avance" En Estudios de Lingüística Aplicada. Num.15 y 16, Volumen , 1992.  

Tabla 22: Publicaciones en revistas del GIL

Capítulos en libros:

Sierra G., Alarcón R., Medina A., Aguilar C. "Definitional Contexts Extraction from Specialised Texts" En Practical Applications in Language and Computers PALC 2003. Peter Lang, Alemania,2004. 21­31   Alarcón R., Sierra G. 

"Hacia la extracción automática de conceptos" En   Proc.   VIII   Simposio   Iberoamericano   de   Terminología   (ISBN   958­33­4022­7).Iberoamericana de Terminología RITerm, Cartagena, Colombia, 2002.    Sierra G., Alarcón R. "Identification of recurrent patterns to extract definitory contexts" En Computational Linguistics and Intelligent Text Processing. Colección en Ciencias de laComputación, Alexander, Springer, Berlin, 2002. 436­438   Sierra G., McNaught J. "Analogy­based method for semantic clustering" En   Computational   Linguistics   and   Intelligent   Text   Processing.   Fondo   de   CulturaEconómica, México, 2002.  

Tabla 23: Trabajados publicados como parte de libros

Tesis:

Metalinguistic Information Extraction from specialized texts  Carlos Rodríguez, Doctorado, Universitat Pompeu Fabra, Noviembre, 2004. (Asesor ToniBadia).    Diseño e implantación de un banco terminológico para el Grupo de Ingeniería Lingüística Garduño   Torres   Gabriel,   Licenciatura,   Facultad   de   Ingeniería,   UNAM,   Agosto,   2003.(Asesor Dr. Gerardo Sierra Martínez).    Investigación cuantitativa de afijos y clíticos del español de México: Glutinometría en elCEMC Medina   Urrea,   A.,   Doctorado,   El   Colegio   de   México,   abril,   2003.   (Asesor   Dr.   LuisFernando Lara).  

Análisis y diseño de un corpus lingüístico en ingeniería Ortega K., Licenciatura, Facultad de Contaduría y Administración, UNAM, febrero, 2003.(Asesor Dr. Gerardo Sierra).    Hacia una obtención computarizada de términos (aplicación concreta al léxico de la físicaen el nivel bachillerato) Reyes A., Licenciatura, Facultad de Filosofía y Letras, UNAM, octubre, 2002. (Asesor Dr.Gerardo Sierra).     Algoritmo revisado para la extracción automática de agrupamientos semánticos  Castillo G., Maestría, Posgrado en Ciencia e Ingeniería de la Computación, octubre, 2002.(Asesor Dr. Gerardo Sierra).   

Design of a concept­oriented tool for terminology. Sierra   G.,   Doctorado,   Department   of   Language   Engineering,   UMIST,   agosto,   1999.(Asesor Dr. John McNaught (UMIST)).  

Bases para la búsqueda onomasiológica de términos Sierra G., Maestría, Instituto de Ingeniería, UNAM, enero, 1996. (Asesor Dr. Felipe Lara yLuis Fernando Lara).  

Tabla 24: Tesis publicadas a partir del trabajado realizado en ingeniería lingüística por miembros delGIL