Metodologías de las humanidades digitales y aplicación ... · Metodologías de las humanidades...

Preview:

Citation preview

Metodologías de las humanidades digitales y aplicación sobre un corpus (de textos) de revistas americanistas

estudio preliminar

Anna SvenssonBiblioteca de la Universidad de Göteborg

IX ENCUENTRO DE CENTROS ESPAÑOLES DE REDIAL"Fondos y recursos iberoamericanos para las humanidades digitales"

Sevilla 29 y 30 de octubre de 2015

GOTHENBURG UNIVERSITY LIBRARY

HUMANITIES LIBRARY)

Objetivos

• Informe de REDIAL sobre revistas americanistas para el congreso CEISAL 2016

• Con América Latina Portal Europeo tenemos un corpus de más de 30 000 artículos

• Explorar métodos de análisis de contenidos con herramientas informáticas como minería de textos, análisis de redes sociales y visualizaciones

• Explorar el app para Zotero, Paper Machines, que funciona como un mostrador de diferentes herramientas aplicables a textos completos

América Latina Portal Europeo como corpus

Formatos posibles:

Excel, CodeGen, CSV, Microsoft Word 2000, JSON, LaTEx, MediaWikiTable, OpenDocument Spreadsheet, OpenDocument Text, PDF, PHP array, Texte Texy!, XML, YAML.

Herramientas probadas

Excel Pivot (estadística y visualización), NodeXL (análisis de redes), Sci2 (análisis de redes, temas, geografías), Wordle (nubes de palabras)

*********************************

DiRT Directory: sitio de herramientas http://dirtdirectory.org/

CLARIN (Common Language Resources and Technology Infrastructure) http://www.clarin.eu/

Analizar metadatos bibliográficos:América Latina Portal Europeo como corpus

• Problemas con datos entrados en campos equivocados

• Problemas con nombres entrados en formas diferentes

• Variedad de exhaustividad de los datos

• Dependiente de la herramienta utilizada para el análisis, varios datos en el mismo campo tiene diferentes consecuencias

La cantidad de registros puede equilibrar estas variedades dependiente de la selección que se quiere analizar?

Ejemplos herramientas y problemas con los datos

Utilizando Excel Pivot (que nos serviría para visualizar estadística) se manifiesta que hay necesidad de separar datos en algunos campus:

28

30

44

69

87

104

111

125

206

219

231

245

246

400

471

499

666

697

850

973

1288

1708

1757

2762

3969

4626

4698

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Guyana

Belice

Jamaica

Guadalupe

Guayana francesa

Martinica

Honduras

Panamá

El Salvador

Costa Rica

Puerto Rico

República Dominicana

Haití

Paraguay

Nicaragua

Guatemala

Ecuador

Uruguay

Bolivia

Venezuela

Colombia

Chile

Perú

Cuba

Brasil

Argentina

México

Núm. palabras claves geográficas 1990-2014 > 25

Excel Pivot

Wordle

Núm. de palabras geográficas total (27249) del corpus del Portal

Wordle

Palabras de los títulos originales de los artículos

Wordle

Palabras de los títulos originales de los artículos en inglés

NodeXL corpus del Portal

Artículos de Manuel Alcántara Sáez y Flávia Freidenberg incluyendo co-autores por revista (nombres separados y corregidos)

NodeXL idiomas del corpus del Portal por revistas

En rojo Anuario de Estudios Americanos

Sci2 visualizando redes: co-autoría

Autores de América Latina Hoy

Autores aparecen como diferentes si los nombres no son uniformes

Paper Machines analizando textos completos

App para Zotero

Ejemplo:América Latina Hoy

(443 textos) y Journal of Latin American Studies

(452 textos)1991-2010895 artículos excluyendo reseñas y editoriales

Mapping Heatmap

Ambas revistas

América Latina Hoy

Nubes

América Latina Hoy

Journal of Latin American Studies

Nubes por tiempo ambas revistas

Topic modelling

Journal of Latin American Studies

Topic modelling

Journal of Latin American Studies

Topic modelling

América Latina Hoy

Topic modelling

América Latina Hoy

Topic modelling

Ambas revistas

Phrase Net

Journal of Latin American Studies

DBPedia

América Latina Hoy

Ngram Viewer

Ejemplo de Google Books https://books.google.com/ngrams/info

Para seguir?

• Cuáles análisis serían interesante para el Informe?

• Cuáles herramientas? Cómo podemos aplicar crítica de fuente a estas herramientas?

• Cómo podemos colaborar con los datos accesibles para adaptarlos a diferentes herramientas y/o mejorar la calidad de los datos?

• Podemos tomar partes del contenido pensado para el informe y escribir un artículo para el Anuario Americanista Europeo y su volumen sobre los Estudios Latinoamericanos Europeos?

Recommended