55
Seminario Seminario Lenguas y culturas Lenguas y culturas hispánicas hispánicas en Internet en Internet Dirección Dirección José Antonio Millán José Antonio Millán MADRID MADRID Residencia de Estudiantes Residencia de Estudiantes 3 de diciembre del 2008 3 de diciembre del 2008

Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Embed Size (px)

Citation preview

Page 1: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

SeminarioSeminarioLenguas y culturas hispánicasLenguas y culturas hispánicas

en Interneten Internet

Dirección Dirección José Antonio MillánJosé Antonio Millán

MADRIDMADRIDResidencia de EstudiantesResidencia de Estudiantes3 de diciembre del 20083 de diciembre del 2008

Page 2: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

ATELIERATELIER

Panorama crítico de Panorama crítico de experiencias para medir experiencias para medir lenguas y culturas en el lenguas y culturas en el

ciberespacio…ciberespacio…

con enfoque especial en el con enfoque especial en el métodométodo

Funredes/Union LatinaFunredes/Union Latina

Page 3: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Daniel Pimienta, Álvaro BlancoDaniel Pimienta, Álvaro [email protected]@[email protected]@funredes.org

FUNDACIÓN REDES Y DESARROLLOFUNDACIÓN REDES Y DESARROLLO

http://funredes.orghttp://funredes.org

http://funredes.org/LC http://funredes.org/LC

Page 4: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

MIEMBRO DEMIEMBRO DEhttp://maaya.orghttp://maaya.org

Page 5: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

FUENTE:FUENTE:

““Doce años de medidas de la diversidad Doce años de medidas de la diversidad lingüística en la Internet: lingüística en la Internet: balance e perspectivasbalance e perspectivas.”.”D. Pimienta, D. Prado, Á. Blanco, 10/2008D. Pimienta, D. Prado, Á. Blanco, 10/2008

A publicar por la Unesco en 2009.A publicar por la Unesco en 2009.

Accesible en: Accesible en: http://funredes.org/lc/espanol/articulos/index.htm

http://funredes.org/lc

Page 6: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

DE QUE SE TRATA?DE QUE SE TRATA?

CONOCER LA REPARTICIÓN DE LOS CONOCER LA REPARTICIÓN DE LOS RECURSOS DE LA INTERNET EN RECURSOS DE LA INTERNET EN TÉRMINOS DE DIVERSIDAD TÉRMINOS DE DIVERSIDAD LINGÜÍSTICA:LINGÜÍSTICA:

InternautasInternautasPáginas web Páginas web CorreosCorreosY mas y mas…Y mas y mas…

Page 7: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

¿DONDE ESTA LA MEDICIÓN DE ¿DONDE ESTA LA MEDICIÓN DE LA DIVERSIDAD LINGÜÍSTICA?LA DIVERSIDAD LINGÜÍSTICA?

EN LA EDAD DE LA PIEDRA…EN LA EDAD DE LA PIEDRA…

REPARTICIÓN DE INTERNAUTASREPARTICIÓN DE INTERNAUTAS DESINFORMACIÓN CRÓNICA SOBRE EL WEBDESINFORMACIÓN CRÓNICA SOBRE EL WEB MUY POCA IDEA DEL RESTOMUY POCA IDEA DEL RESTO

DESPUES DE AÑOS DE TRANCO, LA SITUACIÓN VA DESPUES DE AÑOS DE TRANCO, LA SITUACIÓN VA CAMBIANDO POR FIN CAMBIANDO POR FIN

Page 8: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

¿Y PORQUE TOMARSE LA PENA ¿Y PORQUE TOMARSE LA PENA (Y QUE PENA!!!) DE MEDIR?(Y QUE PENA!!!) DE MEDIR?

LA NECESIDAD DE POLÍTICAS LA NECESIDAD DE POLÍTICAS LINGÚÍSTICAS VIRTUALES…LINGÚÍSTICAS VIRTUALES…

APOYADAS EN DATOS APOYADAS EN DATOS CIENTÍFICAMENTE VALIDADOS.CIENTÍFICAMENTE VALIDADOS.

Page 9: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

...Y PORQUE LA BRECHA ...Y PORQUE LA BRECHA DIGITAL DE CONTENIDOS ES DIGITAL DE CONTENIDOS ES MUCHOMUCHO MAS PROFUNDA QUE MAS PROFUNDA QUE

LA DE ACCESO!LA DE ACCESO!Veamos África:Veamos África:

4 % de los conectados (80% en África del 4 % de los conectados (80% en África del Sur)Sur)

0,6% de las páginas web en inglés0,6% de las páginas web en inglés 0,6% de las páginas web en francés0,6% de las páginas web en francés Entre 0,06 y 0,006% páginas en lenguas Entre 0,06 y 0,006% páginas en lenguas

locales (de las pocas que están localizadas)locales (de las pocas que están localizadas)

Page 10: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

¿Y PARA QUE COMPLICARSE LA ¿Y PARA QUE COMPLICARSE LA VIDA VIRTUAL CON POLÍTICAS? VIDA VIRTUAL CON POLÍTICAS?

APUESTAS APUESTAS CULTURALES, CULTURALES,

SOCIALES, SOCIALES,

ECONÓMICAS, ECONÓMICAS,

ECOLÓGICAS, ECOLÓGICAS,

DE GOBERNANCIADE GOBERNANCIA

Page 11: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

ENTONCES, ¿QUE ES LO QUE ENTONCES, ¿QUE ES LO QUE HAY?HAY?

ESTUDIOSESTUDIOS

TRABAJOSTRABAJOS

PUBLICACIONESPUBLICACIONES

DISCURSOSDISCURSOS

REFERENCIAS…REFERENCIAS…

Page 12: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

APROXIMACIONES PASADASAPROXIMACIONES PASADASMETODOMETODO PROPRO CONCON

USO SENCILLOUSO SENCILLO

MOTOR BUSQUEDAMOTOR BUSQUEDASIMPLESIMPLE MUYMUY APROXIMATIVO APROXIMATIVO

SIMPLISTA…SIMPLISTA…

ALIS/OCLCALIS/OCLC ““creible por creible por fuente… no por fuente… no por

proceso” proceso”

MEJORABLEMEJORABLE

METODO ESTADÍSTICOMETODO ESTADÍSTICO

NO REPETIDO NO REPETIDO

Y… MUCHAS MAS Y… MUCHAS MAS LIMITACIONESLIMITACIONES

VARIOS VARIOS PRODUCTOS EMPR. PRODUCTOS EMPR. MERCADEOMERCADEO

NO TRANSPARENTENO TRANSPARENTE

FUNREDES/ULFUNREDES/UL DOCUMENTADODOCUMENTADO

INDICADORESINDICADORES

REPETIDOREPETIDO

LIMITACIÓN LENGUAS & LIMITACIÓN LENGUAS & ESPACIOESPACIO

Page 13: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

APROXIMACIONES NUEVASAPROXIMACIONES NUEVAS

METODOMETODO PROPRO CONCON

LOPLOP

UPC/IDESCATUPC/IDESCATPODERPODER

SIN LIMITESIN LIMITEALGORITMO DE ALGORITMO DE RECONOCIMIENTORECONOCIMIENTO

TAMAÑO DE CRAWLTAMAÑO DE CRAWL

““A LA ALEXA”A LA ALEXA” COBERTURACOBERTURA

IDEALIDEALNO EXISTE NO EXISTE

FUNREDES/ULFUNREDES/UL CONTRAPESOCONTRAPESO DEBE DEBE LIBERARSELIBERARSE

DE LOS DE LOS MOTORESMOTORES

Page 14: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

COMPLEMENTO DEL ESPACIO COMPLEMENTO DEL ESPACIO VACIOVACIO

BUSCAR : “ –hhwhd3ygfvd”BUSCAR : “ –hhwhd3ygfvd”

A veces los motores responden, A veces los motores responden, incluyendo con la opción lengua, con incluyendo con la opción lengua, con el tamaño total del índice.el tamaño total del índice.

A veces se puede buscar “*-*”.A veces se puede buscar “*-*”.

Muy usado sin documentarla.Muy usado sin documentarla.

Page 15: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

ALIS/OCLCALIS/OCLC

3000 IP al azar (!!!)3000 IP al azar (!!!)

Aplicación una sola vez (!!!!!!) del Aplicación una sola vez (!!!!!!) del algoritmo de reconocimiento de algoritmo de reconocimiento de lengua (!!) …. en la página de lengua (!!) …. en la página de entrada (!!!).entrada (!!!).

Correcciones a la mano Correcciones a la mano

no documentadas(!)no documentadas(!)

Page 16: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

LOP/IDESCATLOP/IDESCAT

Explorar la web y conservar las Explorar la web y conservar las páginas.páginas.

Aplicar algoritmo de reconocimiento de Aplicar algoritmo de reconocimiento de lenguas.lenguas.

LOP enfoca Asia e ÁfricaLOP enfoca Asia e África

Esperamos mas resultados de IDESCATEsperamos mas resultados de IDESCAT

Page 17: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

A LA ALEXAA LA ALEXA

Un programa espía que reportaría el Un programa espía que reportaría el comportamiento de un grupo amplio comportamiento de un grupo amplio y representativo de usuarios podría y representativo de usuarios podría producir datos esenciales…producir datos esenciales…

Nos encantaría poder hacerlo!Nos encantaría poder hacerlo!

Page 18: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

MÉTODO MÉTODO FUNREDES/UNION LATINAFUNREDES/UNION LATINA

BASADO EN MOTORES DE BÚSQUEDABASADO EN MOTORES DE BÚSQUEDA APROXIMACIÓN LINGÜÍSTICA SERIAAPROXIMACIÓN LINGÜÍSTICA SERIA PARTE ESTADÍSTICA MUY CUIDADAPARTE ESTADÍSTICA MUY CUIDADA TOTALMENTE DOCUMENTADOTOTALMENTE DOCUMENTADO SEGUIMIENTO PERMANENTE DESDE 1998SEGUIMIENTO PERMANENTE DESDE 1998 PRODUCE VARIOS INDICADORES PRODUCE VARIOS INDICADORES CONSIDERA VARIOS ESPACIOS CONSIDERA VARIOS ESPACIOS

Page 19: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

MÉTODO MÉTODO FUNREDES/UNION LATINAFUNREDES/UNION LATINA

LIMITADO EN LENGUAS LIMITADO EN LENGUAS (inglés, aleman., (inglés, aleman., español, francés, italiano, portugués, rumano, español, francés, italiano, portugués, rumano, catalán)catalán)

RESULTADOS RELATIVOS AL INGLÉSRESULTADOS RELATIVOS AL INGLÉS MIDE EL WEB VISIBLE E INDEXADOMIDE EL WEB VISIBLE E INDEXADO YA NO CREIBLE DESDE 2006YA NO CREIBLE DESDE 2006 FUTURO INCIERTOFUTURO INCIERTO

Page 20: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

METODOLOGÍAMETODOLOGÍAFUNREDES/UNION LATINAFUNREDES/UNION LATINA

Definición 57 conceptos equivalentes semánticamente Definición 57 conceptos equivalentes semánticamente ===> 1600 términos===> 1600 términos

Medición comparativa ocurrencias con motores de Medición comparativa ocurrencias con motores de búsqueda (automatizada)búsqueda (automatizada)

Método estadístico sólido (distribución, promedio, varianza, Método estadístico sólido (distribución, promedio, varianza, ley de Fischer, intervalo de confianza)ley de Fischer, intervalo de confianza)

Resultados en % del inglésResultados en % del inglés

Evaluación del inglés aproximativa lleva a resultados Evaluación del inglés aproximativa lleva a resultados absolutos en otras lenguasabsolutos en otras lenguas

Page 21: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

CRITERIOS PARA SELECCIÓN CRITERIOS PARA SELECCIÓN DE CONCEPTOS: DE CONCEPTOS:

Neutralidad cultural Neutralidad cultural Homografia trans-lingüísticaHomografia trans-lingüísticaHomografía trans-lingüística con palabra compuestaHomografía trans-lingüística con palabra compuestaHomografía trans-lingüística par empruntHomografía trans-lingüística par empruntHomografía con abreviaciónHomografía con abreviaciónHomografía con nombre propio frecuenteHomografía con nombre propio frecuenteSeudo-homografía trans-lingüísticaSeudo-homografía trans-lingüísticaSignificaciones no equivalentesSignificaciones no equivalentesMorfo-síntaxis no equivalente : nom, verbeMorfo-síntaxis no equivalente : nom, verbeMorpho-síntaxis no equivalente : adjectivos y nombresMorpho-síntaxis no equivalente : adjectivos y nombresPluricentrismo lexicográfico y semánticoPluricentrismo lexicográfico y semánticoPluricentrismo ortográficoPluricentrismo ortográficoFormas agregadas (alemán)Formas agregadas (alemán)

Page 22: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Neutralidad culturalNeutralidad cultural

Propiedad de una palabra en relación Propiedad de una palabra en relación con su frecuencia de uso en la lengua en con su frecuencia de uso en la lengua en función de la cultura respectiva.función de la cultura respectiva.

Las palabras francesasLas palabras francesas vinvin,, parfumparfum, , gastronomiegastronomie y las palabras del lenguaje diplomático no son y las palabras del lenguaje diplomático no son neutras culturalmente, en relación con el francés.neutras culturalmente, en relación con el francés.

Para obtener una muestra con el coeficiente de Para obtener una muestra con el coeficiente de variación menor posible, se dejaron de lado las variación menor posible, se dejaron de lado las palabras no neutras culturalmente.palabras no neutras culturalmente.

Page 23: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Homografía interlingüísticaHomografía interlingüística

La grafía de una palabra en un idioma es idéntica a la de otra La grafía de una palabra en un idioma es idéntica a la de otra palabra en otro idioma, incluido el caso de palabra en otro idioma, incluido el caso de faux amisfaux amis (significación diferente). Puede haber homografías con o (significación diferente). Puede haber homografías con o sin diacríticos.sin diacríticos.

Ejemplo de grafía idéntica (con el mismo sentido): casa en Ejemplo de grafía idéntica (con el mismo sentido): casa en castellano y portugués. castellano y portugués.

Ejemplos de Ejemplos de faux amisfaux amis: : red en castellano y en inglésred en castellano y en inglés; ; hier hier en francés y alemánen francés y alemán..

Rechazar las palabras homógrafas (con o sin diacríticos).Se Rechazar las palabras homógrafas (con o sin diacríticos).Se han tenido en cuenta, para rechazarlas, las homografías han tenido en cuenta, para rechazarlas, las homografías entre los idiomas del estudio o con un idioma muy entre los idiomas del estudio o con un idioma muy presente en la Internet, como el alemán. Para evitar el presente en la Internet, como el alemán. Para evitar el riesgo estadístico de homografías con otros idiomas, se riesgo estadístico de homografías con otros idiomas, se descartan por principio las palabras de menos de cuatros descartan por principio las palabras de menos de cuatros letras.letras.

Page 24: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Homografía interlingüística por Homografía interlingüística por préstamopréstamo

Cuando una palabra de un idioma es aceptada tal Cuando una palabra de un idioma es aceptada tal cual en otro.cual en otro.

Anglicismos comme Anglicismos comme businessbusiness,, s sandwichandwich o o softwaresoftware. .

El galicismo, El galicismo, deja vudeja vu en inglés, castellano, etc. en inglés, castellano, etc. (homógrafo de la expresión francesa sin (homógrafo de la expresión francesa sin diacríticos).diacríticos).

Excluir sistemáticamente o deducir (Excluir sistemáticamente o deducir (mardi-grasmardi-gras))

Page 25: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Homografía con una abreviaciónHomografía con una abreviación

SeptSept, , sietesiete en francés, homógrafo de en francés, homógrafo de las abreviaciones de las abreviaciones de septiembreseptiembre en en varios idiomas, sobre todo envarios idiomas, sobre todo en inglés.inglés.

Evitar estas palabras.Evitar estas palabras.

Estamos relativamente protegidos por Estamos relativamente protegidos por la consigna de evitar palabras de la consigna de evitar palabras de menos de cuatros letras.menos de cuatros letras.

Page 26: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Homografía con un nombre Homografía con un nombre propio frecuentepropio frecuente

WindowsWindows es es ventanaventana en inglés.... en inglés.... pero es asimismo el nombre de un pero es asimismo el nombre de un programa muy citado en la Internet.programa muy citado en la Internet.

Evitar estas palabras.Evitar estas palabras.

Page 27: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Pseudohomografía Pseudohomografía interlingüísticainterlingüística

La escritura de una palabra con une error de La escritura de una palabra con une error de ortografía frecuente en un idioma ortografía frecuente en un idioma corresponde a otra en otro idioma.corresponde a otra en otro idioma.

AmbasadorAmbasador en rumano puede confundirse en rumano puede confundirse con con ambas(s)adorambas(s)ador en inglés.en inglés.

Se rechazan estas palabras solamente si Se rechazan estas palabras solamente si la lengua con que se confunde es el inglés.la lengua con que se confunde es el inglés.

Page 28: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Significados no equivalentesSignificados no equivalentes

PrixPrix en francés equivale en su en francés equivale en su significado a significado a premiopremio y a y a precioprecio..

Evitar estas palabras, salvo si fuera Evitar estas palabras, salvo si fuera posible incluir todos los significantes posible incluir todos los significantes que completarían el sentido en las que completarían el sentido en las lenguas que lo necesiten.lenguas que lo necesiten.

Page 29: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Morfosintaxis no equivalente: Morfosintaxis no equivalente: sustantivo, verbosustantivo, verbo

El inglés es diferente morfo-sintácticamente de los demás El inglés es diferente morfo-sintácticamente de los demás idiomas estudiados, suele tener una misma forma como idiomas estudiados, suele tener una misma forma como sustantivo y variante verbal, ésta última equivalente a su sustantivo y variante verbal, ésta última equivalente a su vez de muchas formas conjugadas en los demás idiomas.vez de muchas formas conjugadas en los demás idiomas.

LoveLove en inglés es el sustantivo que significa en inglés es el sustantivo que significa amoramor y el verbo y el verbo amaramar: en el infinitivo (cuando sigue a : en el infinitivo (cuando sigue a toto), en el presente ), en el presente del indicativo (del indicativo (amo, amas, ama, amamos, amáis, amo, amas, ama, amamos, amáis, amanaman), etc.), etc.

Evitar estas palabras.Evitar estas palabras.

Esta característica del inglés nos lleva a Esta característica del inglés nos lleva a excluir los verbosexcluir los verbos..

Page 30: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Morfosintaxis no equivalente: Morfosintaxis no equivalente: adjetivos y sustantivosadjetivos y sustantivos

Adjetivos, invariables en inglés, varían en género y en número Adjetivos, invariables en inglés, varían en género y en número en los demás idiomas estudiados. en los demás idiomas estudiados.

Los sustantivos, que en general sólo varían en número en los Los sustantivos, que en general sólo varían en número en los demás idiomas, varían en rumano también según el caso demás idiomas, varían en rumano también según el caso (nominativo, genitivo, etc.) y la diferencia determinado / no (nominativo, genitivo, etc.) y la diferencia determinado / no determinado.determinado.

El adjetivo inglés El adjetivo inglés yellowyellow corresponde a corresponde a amarilloamarillo / / amarillaamarilla / / amarillosamarillos / / amarillasamarillas. El sustantivo inglés . El sustantivo inglés instability / instability / instabilitiesinstabilities a las variantes rumanas siguientes:a las variantes rumanas siguientes: instabilitateinstabilitate / / instabilitateainstabilitatea / / instabilităţiiinstabilităţii / / instabilităţiinstabilităţi / / instabilităţileinstabilităţile / / instabilităţilorinstabilităţilor. .

Incluir las variantes de género, número y caso en los Incluir las variantes de género, número y caso en los idiomas en la necesidad de equivalencia lo exige.idiomas en la necesidad de equivalencia lo exige.

Page 31: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Pluricentrismo léxico y Pluricentrismo léxico y semánticosemántico

Cuando un idioma tiene más de un centro Cuando un idioma tiene más de un centro normativo léxico-semántico.normativo léxico-semántico.

Según el país hispanohablante, se dice Según el país hispanohablante, se dice nafta nafta o o gasolinagasolina. .

Americano,Americano, en muchos países de América Latina, en muchos países de América Latina, no tiene el mismo sentido que en otros o en no tiene el mismo sentido que en otros o en España.España.

Incluir las variantes sinonímicas nacionales o Incluir las variantes sinonímicas nacionales o regionales cuando corresponda.regionales cuando corresponda.

Page 32: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Pluricentrismo ortográficoPluricentrismo ortográfico

Cuando un idioma tiene más de un centro Cuando un idioma tiene más de un centro normativo ortográfico.normativo ortográfico.

Casos del inglés y del portugués: ortografía Casos del inglés y del portugués: ortografía diferente en EE. UU. y en el Reino Unido diferente en EE. UU. y en el Reino Unido ((theatertheater y y theatretheatre)), en Portugal y en , en Portugal y en Brasil (Brasil (electricidade electricidade y y eletricidadeeletricidade).).

Incluir las variantes ortográficas Incluir las variantes ortográficas nacionales o regionales cuando nacionales o regionales cuando corresponda.corresponda.

Page 33: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

Formas agregadas Formas agregadas

Las formas agregadas son comunes en Las formas agregadas son comunes en alemán y el motor no las contabiliza.alemán y el motor no las contabiliza.

Corregir globalmente las cifras en Corregir globalmente las cifras en función de un porcentage de función de un porcentage de frecuencia.frecuencia.

Page 34: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

CONCEPTOS: EJEMPLOSCONCEPTOS: EJEMPLOS

INGLÉS: cheese, cheeses INGLÉS: cheese, cheeses

ESPAÑOL: queso, quesos ESPAÑOL: queso, quesos

FRANCÉS: fromage, fromagesFRANCÉS: fromage, fromages

ITALIANO: formaggi, formaggio ITALIANO: formaggi, formaggio

PORTUGUÉS: queijo, queijos PORTUGUÉS: queijo, queijos

RUMANO: branza, branze, branzei, branzele, branzelor, branzeturi, RUMANO: branza, branze, branzei, branzele, branzelor, branzeturi, branzeturile, branzeturilorbranzeturile, branzeturilorbrânza, brânze, brânzei, brânzele, brânzelor, brânzeturi, brânza, brânze, brânzei, brânzele, brânzelor, brânzeturi, brânzeturile, brânzeturilor, brânzã brânzeturile, brânzeturilor, brânzã

ALEMÁN: kaese, kaesen, kase, kasen, käse, käsenALEMÁN: kaese, kaesen, kase, kasen, käse, käsen

Page 35: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

CONCEPTOS: EJEMPLOSCONCEPTOS: EJEMPLOS

INGLÉS: yellowINGLÉS: yellowESPAÑOL: amarilla,amarillas amarillo, ESPAÑOL: amarilla,amarillas amarillo,

amarillosamarillosFRANCÉS: jaune, jaunesFRANCÉS: jaune, jaunesITALIANO: gialla, gialle, gialli, gialloITALIANO: gialla, gialle, gialli, gialloPORTUGUÉS: Amarela, amarelas, amarelo, PORTUGUÉS: Amarela, amarelas, amarelo,

amarelosamarelosRUMANO: Galben, galbena, galbene, RUMANO: Galben, galbena, galbene,

galbeni, galbenãgalbeni, galbenãALEMÁN: gelb, gelbe, gelbem, gelben, ALEMÁN: gelb, gelbe, gelbem, gelben,

gelber, gelbes gelber, gelbes

Page 36: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

MOTORES DE BÚSQUEDAMOTORES DE BÚSQUEDAentre maravilla y pesadilla…entre maravilla y pesadilla…

LOS HEMOS PROBADOS TODOS: LOS HEMOS PROBADOS TODOS:

Altavista, Excite, Fastsearch Altavista, Excite, Fastsearch (Alltheweb), Google, Hotbot, (Alltheweb), Google, Hotbot, Infoseek, iWon, Lycos, Infoseek, iWon, Lycos, Northernlight, Yahoo et WebtopNorthernlight, Yahoo et Webtop....

Page 37: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

MOTORES DE BÚSQUEDAMOTORES DE BÚSQUEDASELECCIÓNSELECCIÓN

Para cada estudio se selecciona el Para cada estudio se selecciona el mejor con esos criterios: mejor con esos criterios:

- Fiabilidad de contabilidad de Fiabilidad de contabilidad de ocurrenciasocurrencias

- Gestión de diacríticosGestión de diacríticos- Coherencia de resultadosCoherencia de resultados- Tamaño del índiceTamaño del índice- Limitación de sezgosLimitación de sezgos

Page 38: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

MOTORES DE BÚSQUEDAMOTORES DE BÚSQUEDAun medio bastante opacoun medio bastante opaco

CASI SIEMPRE HAY PROBLEMASCASI SIEMPRE HAY PROBLEMAS

TOMA TIEMPO PARA VALIDAR Y TOMA TIEMPO PARA VALIDAR Y ENTENDER LOS FENÓMENOSENTENDER LOS FENÓMENOS

A MENUDO ESTUVIMOS MUY CERCA A MENUDO ESTUVIMOS MUY CERCA DE ABANDONAR…DE ABANDONAR…

Page 39: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

MÉTODO ESTADÍSTICOMÉTODO ESTADÍSTICO

- Distribución normal (Gauss)Distribución normal (Gauss)

- Analisis del coeficiente de Varianza Analisis del coeficiente de Varianza para validar resultadospara validar resultados

- Interval de confianza a 90% e 99% Interval de confianza a 90% e 99% calculados a partir de la distribución calculados a partir de la distribución Student-FisherStudent-Fisher

Page 40: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

PROGRAMACIÓNPROGRAMACIÓN

Interfaz a los motores automatizado Interfaz a los motores automatizado en PHPen PHP

Nutre base de datos de resultados Nutre base de datos de resultados para conservación y comparaciónpara conservación y comparación

Page 41: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

PRODUCTOSPRODUCTOS

PORCENTAJEE DE CADA IDIOMA PORCENTAJEE DE CADA IDIOMA COMPARADO CON INGLÉSCOMPARADO CON INGLÉS

COEFICIENTE DE VARIANZACOEFICIENTE DE VARIANZA

INTERVAL DE CONFIANZAINTERVAL DE CONFIANZA

Page 42: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

EVALUACIÓN DEL EVALUACIÓN DEL PORCENTAJE DEL INGLÉSPORCENTAJE DEL INGLÉS

- La parte le menos científica La parte le menos científica

- Realizada cruzando datos de los Realizada cruzando datos de los lenguajes no medidoslenguajes no medidos

- Cada día mas difícilCada día mas difícil

Page 43: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

RESULTADOS DERIVADOS E RESULTADOS DERIVADOS E INDICADORESINDICADORES

- PORCENTAJE ABSOLUTO

- PRESENCIA PONDERADA

-PRODUCTIVIDAD

- EVOLUCIONES

Page 44: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

EVOLUCIÓN % PAGINAS WEB EVOLUCIÓN % PAGINAS WEB EN COMPAR. CON INGLÉSEN COMPAR. CON INGLÉS

FUNREDESFUNREDES 1998-2008 1998-2008Evolución de las lenguas latinas con respecto al Inglés

0,00%

2,00%

4,00%

6,00%

8,00%

10,00%

12,00%

14,00%

16,00%

18,00%

sep-

98no

v-98

ene-

99m

ar-9

9m

ay-9

9ju

l-99

sep-

99no

v-99

ene-

00m

ar-0

0m

ay-0

0ju

l-00

sep-

00no

v-00

ene-

01m

ar-0

1m

ay-0

1ju

l-01

sep-

01no

v-01

ene-

02m

ar-0

2m

ay-0

2ju

l-02

sep-

02no

v-02

ene-

03m

ar-0

3m

ay-0

3ju

l-03

sep-

03no

v-03

ene-

04m

ar-0

4m

ay-0

4ju

l-04

sep-

04no

v-04

ene-

05m

ar-0

5m

ay-0

5ju

l-05

sep-

05no

v-05

ene-

06m

ar-0

6m

ay-0

6ju

l-06

sep-

06no

v-06

ene-

07m

ar-0

7m

ay-0

7ju

l-07

sep-

07no

v-07

Español

Francés

Italiano

PortuguésRumano

Alemán

Catalán

Page 45: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

   INGLESINGLES ESP.ESP. FR.FR. IT.IT. POR.POR. RUM.RUM. AL.AL. CAT.CAT. TOT.TOT.

LocutoresLocutores(millones)(millones) 670670 400400 130130 6060 205205 3030 120120 99 66006600

Locutores Locutores (% pop. mundial)(% pop. mundial) 10.1%10.1% 6.1%6.1% 2.0%2.0% 0.9%0.9% 3.1%3.1% 0.5%0.5% 1.8%1.8% 0.1%0.1% 130%130%

InternautasInternautas(millones)(millones) 366366 102102 5858 3131 4747 55 5959 22 11541154

InternautasInternautas(%)(%) 54.6%54.6% 25.4%25.4% 44.9%44.9% 52.3%52.3% 23.1%23.1% 16.5%16.5% 49.1%49.1% 23.1%23.1% 17.5%17.5%

Internautas Internautas (% pop. mundial)(% pop. mundial) 5.5%5.5% 1.5%1.5% 0.9%0.9% 0.5%0.5% 0.7%0.7% 0.1%0.1% 0.9%0.9% 0.0%0.0% 17.5%17.5%

% de Internautas % de Internautas por lenguapor lengua 32%32% 9%9% 5%5% 3%3% 4%4% 0%0% 5%5% 0.2%0.2% 130%130%

% de paginas web % de paginas web por lenguapor lengua 45.0%45.0% 3.8%3.8% 4.4%4.4% 2.7%2.7% 1.4%1.4% 0.3%0.3% 5.9%5.9% 0.1%0.1% 100%100%

Productividad Productividad por lenguapor lengua 1.421.42 0.430.43 0.870.87 0.980.98 0.340.34 0.660.66 1.161.16 0.740.74 11

Pagina web Pagina web per internautaper internauta 4.444.44 0.630.63 2.242.24 2.932.93 0.450.45 0.620.62 3.253.25 0.960.96   

INDICADORES 2008

Page 46: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

MAS RESULTADOS MAS RESULTADOS DERIVADOS E INDICADORESDERIVADOS E INDICADORES

PARTIENDO DE BÚSQUEDA:

- POR DOMINIO GENÉRICO- POR DOMINIOS DE PAÍSES- POR PAÍSES- POR LENGUAS

PRODUCTIVIDAD DE PAGINAS WEB EN UNA LENGUA DADA POR PAÍS…

Page 47: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

¿QUE PAÍSES PRODUCEN ¿QUE PAÍSES PRODUCEN CONTENIDOS EN FRANCÉS?CONTENIDOS EN FRANCÉS?

Noviembre Noviembre 20072007

MayoMayo2000520005

MarzoMarzo20032003

FRANCIAFRANCIA 60% -1,09 60% -1,09 60% - 0,8260% - 0,82 54% - 0,9654% - 0,96

CANADA CANADA 20% - 1,0620% - 1,06 19% - 1,2719% - 1,27 24% - 1,8324% - 1,83

BELGICABELGICA 7% - 0,607% - 0,60 8% - 1,558% - 1,55 7 % - 2,217 % - 2,21

SUIZASUIZA 5% - 0,875% - 0,87 5% - 2,785% - 2,78 6% - 2,176% - 2,17

OTROSOTROS 8% - 0,848% - 0,84 8% - 1,388% - 1,38 9% - 3,109% - 3,10

FUENTE: FUNREDES/UL

Page 48: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

¿QUE REGIONES PRODUCEN ¿QUE REGIONES PRODUCEN CONTENIDOS EN FRANCÉS?CONTENIDOS EN FRANCÉS?

20072007 20052005 20032003

EUROPAEUROPA    75%75% 79%79% 71%71%

AMERICAAMERICA    22%22% 21%21% 25%25%

AFRICA/MEDIO ORIENTEAFRICA/MEDIO ORIENTE 0.3%0.3% 0.4%0.4% 0,4%0,4%

ASIA/OCEANIAASIA/OCEANIA 0.2%0.2% 0.4%0.4% 0,4%0,4%

NO CLASIFICADONO CLASIFICADO 2,11%2,11% 0.19%0.19% 3.32%3.32%

FUENTE: FUNREDES/UL

Page 49: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

¿QUE PAÍSES PRODUCEN¿QUE PAÍSES PRODUCEN CONTENIDOS EN ESPAÑOL? CONTENIDOS EN ESPAÑOL?

FUENTE: FUNREDES/ULFUENTE: FUNREDES/UL

20072007 20052005 20012001

ESPAÑAESPAÑA 56% - 3.4 56% - 3.4 48 % - 2.448 % - 2.4 54% - 2.754% - 2.7

EEUUEEUU 10% - 0.410% - 0.4 14% - 0.414% - 0.4 5 % - 0.125 % - 0.12

ARGENTINAARGENTINA 9.4 – 0.99.4 – 0.9 10.6% - 1.910.6% - 1.9 9.6% - 1.39.6% - 1.3

MEXICOMEXICO 8.4% - 0.458.4% - 0.45 7.4 % - 0.57.4 % - 0.5 8.6 % - 0.458.6 % - 0.45

Page 50: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

QUE PAÍSES PRODUCENQUE PAÍSES PRODUCEN CONTENIDOS EN PORTUGUÉS? CONTENIDOS EN PORTUGUÉS?

FUENTE: FUNREDES/ULFUENTE: FUNREDES/UL

20072007 20052005

BRASILBRASIL 71% - 0.9071% - 0.90 71 % - 0.9571 % - 0.95

PORTUGALPORTUGAL 15 % - 0.9815 % - 0.98 17 % - 1.017 % - 1.0

USAUSA 4 % - 5.04 % - 5.0 8 % - 5.48 % - 5.4

SPAINSPAIN 3.8 % - 3.73.8 % - 3.7 2.3 % - 1.22.3 % - 1.2

Page 51: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

QUE PAÍSES PRODUCEN QUE PAÍSES PRODUCEN CONTENIDOS EN INGLÉS?CONTENIDOS EN INGLÉS?

FUENTE: FUNREDES/ULFUENTE: FUNREDES/UL

nov-07nov-07 may-05may-05

EEUUEEUU 66% - 166% - 1 51 % - 0,851 % - 0,8

INGLATERRAINGLATERRA 6.5% - 0,66.5% - 0,6 7,2 % - 0,67,2 % - 0,6

CANADACANADA 3.5% - 0,73.5% - 0,7 5 % - 0,75 % - 0,7

AUSTRALIAAUSTRALIA 1.5 % - 0,31.5 % - 0,3 1.8 % - 0,41.8 % - 0,4

ALEMAÑAALEMAÑA 1.2 % - 391.2 % - 39 1.9 % - 571.9 % - 57

Page 52: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

¿CUAL ES EL ESPACIO DEL SUR ¿CUAL ES EL ESPACIO DEL SUR EN ESTA PRODUCCIÓN?EN ESTA PRODUCCIÓN?

FUENTE: FUNREDES/ULFUENTE: FUNREDES/UL

En FRANCÉS: África + Asia < 0.8% (menos que España o En FRANCÉS: África + Asia < 0.8% (menos que España o

Italia...). Italia...). Destacan: Marruecos, Senegal y VietnamDestacan: Marruecos, Senegal y Vietnam

En ESPAÑOL: America latina = 35% producción totalEn ESPAÑOL: America latina = 35% producción totalDestaca: Nicaragua y Cuba en productividadDestaca: Nicaragua y Cuba en productividadEn rojo: Guatemala, Honduras, Costa Rica, Puerto Rico, PerúEn rojo: Guatemala, Honduras, Costa Rica, Puerto Rico, Perú

En INGLÉS : Producción del Sur totalmente marginal excepto En INGLÉS : Producción del Sur totalmente marginal excepto África del Sur, China, Brasil, algunas islas del Pacifico (uso África del Sur, China, Brasil, algunas islas del Pacifico (uso negociado del dominio nacional!), Corea del Sur, India, negociado del dominio nacional!), Corea del Sur, India, Filipinas.Filipinas.

Destaca (del Norte): Alemania, Francia, Italia, Holanda, Japón, Destaca (del Norte): Alemania, Francia, Italia, Holanda, Japón, Suiza, Rusia, Suecia, España con productividades enormes...Suiza, Rusia, Suecia, España con productividades enormes...

Page 53: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

OTRAS ACTIVIDADES DEL OTRAS ACTIVIDADES DEL OBSERVATORIO DE FUNREDESOBSERVATORIO DE FUNREDES

- Otros espacios: newsgroups, blogosfera, Otros espacios: newsgroups, blogosfera, wikipediawikipedia

- ““Medición” muy aproximativa de las Medición” muy aproximativa de las culturas a través las citaciones de culturas a través las citaciones de personajes y evaluando las evoluciones.personajes y evaluando las evoluciones.

- Automatización de la traducción por Automatización de la traducción por programa en listas de discusiónprograma en listas de discusión

Page 54: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

EL FUTURO DE NUESTRO EL FUTURO DE NUESTRO METODOMETODO

Posiblemente hemos cumplido Posiblemente hemos cumplido nuestro rol y debemos dejar el nuestro rol y debemos dejar el espacio a proceso mas “industriales”espacio a proceso mas “industriales”

Tal vez podríamos considerar Tal vez podríamos considerar lanzarnos (o mejor negociar con lanzarnos (o mejor negociar con alguien) para aplicar el método no alguien) para aplicar el método no sobre los motores sino sobre el sobre los motores sino sobre el mismo web…mismo web…

Page 55: Seminario Lenguas y culturas hispánicas en Internet Dirección José Antonio Millán MADRID Residencia de Estudiantes 3 de diciembre del 2008

REFERENCIASREFERENCIAS

- Measuring linguistic diversity on the Internet, UNESCO, 12/2005, a Measuring linguistic diversity on the Internet, UNESCO, 12/2005, a ccollection of papers by: John Paolillo, Daniel Pimienta, Daniel Prado, ollection of papers by: John Paolillo, Daniel Pimienta, Daniel Prado,

et al. et al. http://http://portal.unesco.org/ci/en/ev.php-portal.unesco.org/ci/en/ev.php-URL_ID=20882&URL_DO=DO_TOPIC&URL_SECTION=201.htmlURL_ID=20882&URL_DO=DO_TOPIC&URL_SECTION=201.html

- - Activités de Funredes pour la promotion de la diversité linguistique Activités de Funredes pour la promotion de la diversité linguistique dans l'Internet et enseignements de l'expérience, 5/05dans l'Internet et enseignements de l'expérience, 5/05

http://portal.unesco.org/ci/en/file_download.php/92a27500bf11f4c73cd567943debhttp://portal.unesco.org/ci/en/file_download.php/92a27500bf11f4c73cd567943deb4077Daniel+Pimienta.doc4077Daniel+Pimienta.doc

-“Quel espace reste-t-il dans l’Internet, hors la langue anglaise et la -“Quel espace reste-t-il dans l’Internet, hors la langue anglaise et la culture "made in USA" ?”, in « Nord et Sud numériques », Les culture "made in USA" ?”, in « Nord et Sud numériques », Les

Cahiers du Numériques, Vol 2 No 3/4 Hermès, Numéro spécial sur la Cahiers du Numériques, Vol 2 No 3/4 Hermès, Numéro spécial sur la fracture numérique, 2001fracture numérique, 2001

http://funredes.org/lc/l5/cahiersNumFinal.htmlhttp://funredes.org/lc/l5/cahiersNumFinal.html