View
229
Download
6
Category
Preview:
Citation preview
Recopilación de herramientasde procesamiento y visualización
de datos
Madrid, Junio 2013
ContenidosContenidos...............................................................................................................................2
1 Introducción.............................................................................................................................3
2 Características de las herramientas..........................................................................................4
2.1 Herramientas de procesamiento.....................................................................................4
A.Herramientas de depuración...............................................................................................4
B.Herramientas de conversión................................................................................................6
2.2 Herramientas de análisis estadístico................................................................................6
2.3 Servicios de visualización.................................................................................................6
C. Aplicaciones de visualización genéricos...............................................................................7
D.Wizards, librerías, API........................................................................................................11
E. Herramientas de visualización geoespacial.......................................................................17
F. Herramientas de visualización de datos temporales..........................................................19
2.4 Herramientas para el análisis de redes..........................................................................20
3 Comparativa...........................................................................................................................22
4 Conclusiones finales...............................................................................................................24
document.docx 2
1 IntroducciónEn los últimos años se ha producido una enorme proliferación de datos en bruto, que deben
ser procesados y preparados en una forma comprensible para el usuario final.
Todos estos datos en bruto suelen ser difíciles de entender, de ahí que se hayan desarrollado
distintas herramientas de visualización que faciliten su interpretación.
Sin embargo, este tipo de herramientas, por impactante que puedan ser sus resultados, no so-
luciona los problemas que puede generar una baja calidad de los datos fuente. De ello se de-
duce la importancia de trabajar adecuadamente con los datos, antes de proceder a su trata-
miento gráfico. El esquema clásico de tratamiento de datos, previo a la ejecución de cualquier
análisis, establece que hay que prestar atención a las técnicas de adquisición de los datos, y lle -
var a cabo un estudio de los datos obtenidos para asegurar que representan adecuadamente
al universo de discurso. Una vez asegurados ambos, se puede proceder a someter al conjunto
en cuestión a análisis (exploratorio, cualitativo…), y obtener los resultados y la visualización
que mejor se ajuste a los resultados obtenidos, y a la información que se quiere transmitir.
El presente documento incluye una recopilación de las mejores herramientas de procesamien-
to, análisis y visualización de datos gratuitas que se ofrecen actualmente en el mercado.
document.docx 3
2 Características de las herramientas Para crear un buen análisis y visualización de datos, lo más importante es conocer y entender
las herramientas disponibles y su correcta aplicación en los campos relacionados.
Existen muchas herramientas para ayudar a transformar los datos en gráficos, pero éstas
pueden conllevar un alto coste.
A continuación se presenta una selección de las mejores herramientas de tratamiento y
visualización de datos gratuitas, agrupadas en base a su uso y aplicación principales.
2.1 Herramientas de procesamientoLas tres herramientas que se muestran a continuación han sido diseñadas para ayudar en la
depuración y transformación de los datos a analizar.
A. Herramientas de depuración
2.1.1 DataWrangler
TIPO. Aplicación Web
TECNOLOGÍA. HTML
LICENCIA. De uso libre
ENLACES.
Sitio web. http://vis.stanford.edu/wrangler/
Trabajo de investigación. http://vis.stanford.edu/papers/wrangler
Aplicación web interactiva para la limpieza y transformación de datos. Wrangler combina la
manipulación directa de los datos visualizados con la inferencia automática de las
transformaciones de datos relevantes, lo que permite a los analistas la exploración repetida del
espacio de operaciones aplicable y prever sus efectos.
Aprovecha los tipos de datos semánticos (localizaciones geográficas, fechas, códigos de
clasificación) para ayudar a la validación y conversión de tipos.
2.1.2 Google Refine
TIPO. Aplicación de escritorio
TECNOLOGÍA. Java
document.docx 4
LICENCIA. BSD
ENLACES.
Sitio web. http://code.google.com/p/google-refine/
Documentación para usuarios. http://code.google.com/p/google-refine/wiki/Docu-
mentationForUsers
Documentación para desarrolladores. http://code.google.com/p/google-refine/
wiki/DocumentationForDevelopers
Herramienta gratuita diseñada con los objetivos de ayudar a entender la estructura y calidad
de los datos, y permitir corregir determinados tipos de errores comunes a ellos.
Admite un amplio abanico de formatos: TSV, CSV, *SV, Excel (.xls y .xlsx), JSON, XML, RDF como
XML, y documentos Google Data. La fuente de datos puede ser de 4 tipos: a partir de fichero
local, desde una URL (puede importar datos de una tabla de una web, de un xml,...),
directamente desde clipboard o enlazando un documento de Google Docs. Una vez tratados los
datos se pueden volver a exportar para su uso fuera de Google Refine en los formatos TSV (Tab
separated values), CSV (Comma separated values), Excel y HTML table.
Google Refine tiene tres aspectos a destacar:
Limpieza de datos. Permite cambiar contenido de celdas y unificar campos, de forma
manual o ayudado por el propio programa (el sistema es capaz de sugerir optimizacio-
nes).
Transformación de datos. A través de las instrucciones que se pueden usar mediante el
lenguaje GREL propio de Google Refine. Permite dividir columnas, crear nuevas colum-
nas según el valor de otra columna, tomar parte del contenido de una columna para
crear otra nueva,...
Creación de nuevos campos de datos. Mediante servicios externos para poder dispo-
ner de datos nuevos a partir de datos ya existentes; o haciendo uso de Freebase (base
de datos libre colaborativa) para hacer una conciliación de datos.
document.docx 5
B. Herramientas de conversión
2.1.3 Mr. Data Converter
TIPO. Biblioteca
TECNOLOGÍA. JavaScript
LICENCIA. MIT
ENLACES.
Sitio web. http://shancarter.com/data_converter/
Repositorio GitHub. https://github.com/shancarter/Mr-Data-Converter
Aplicación web que convierte los datos de Excel en uno de varios formatos web amigables,
incluyendo HTML, JSON y XML.
2.2 Herramientas de análisis estadísticoHerramientas para la combinación de representaciones gráficas de los datos junto con un
análisis numérico robusto.
2.2.1 The R Project for Statistical Computing
TIPO. Lenguaje de programación
TECNOLOGÍA. R
LICENCIA. GPL
ENLACES.
Sitio web. http://www.r-project.org/
R es un lenguaje y entorno de programación para gráficos y computación estadísticos, de
distribución libre y de código abierto.
Lenguaje basado en comandos, lo que permite crear gráficos a medida, y no sólo d elos tipos
de gráficos estandarizados, sino de nuevos gráficos adecuados al conjunto de datos y al
problema tratado.
2.3 Servicios de visualizaciónA continuación se describen algunas de las herramientas de visualización gratuitas clasificadas
de acuerdo a sus características tecnológicas
document.docx 6
A. Aplicaciones de visualización genéricos
Herramientas que ofrecen diversas opciones de visualización. Aunque algunas siguen
apostando por las tablas y gráficos convencionales, muchas otras abogan por ofrecer nuevas
opciones tales como diagramas de árbol y nubes de palabras.
2.3.1 Google Fusion Tables
TIPO. Aplicación Web y API
TECNOLOGÍA. JavaScript, Flash
LICENCIA. De uso libre
ENLACES.
Sitio web. http://www.google.com/fusiontables/
Galería de imágenes. https://sites.google.com/site/fusiontablestalks/stories/
Documentación de la API. https://developers.google.com/fusiontables/
Aplicación web que permite organizar, gestionar, colaborar, visualizar y publicar datos en la web
de una manera sencilla.
Gestiona grandes colecciones de datos que deben estar normalizados y guardados en un
archivo Excel, .ods, .csv o .kml.
Permite visualizar los datos mediante gráficos circulares, gráficos de barras, diagramas de
dispersión y líneas de tiempo; así como mapas geográficos basados en Google Maps.
2.3.2 Tableau Public
TIPO. Aplicación de escritorio
TECNOLOGÍA. Windows, JavaScript
LICENCIA. De uso libre
ENLACES.
Sitio web. http://www.tableausoftware.com/public/
Galería. http://www.tableausoftware.com/public/gallery
Herramienta gratuita de visualización de datos mediante gráficos que combina algunos
elementos tradicionales de las herramientas de business intelligence como puedan ser el
document.docx 7
modelo de organización de variables mediante el uso de dimensiones y medidas o la conexión
con otros sistemas de gestión de información como las bases de datos o las hojas de cálculo
con el uso de un interfaz gráfico atractivo, eficiente y rápido.
Algunas de las características más relevantes de esta herramienta son:
Detección de datos rápida y fácil. Permite trabajar con bases de datos y hojas de cálcu-
lo de cualquier tamaño. Acepta formatos como Excel, Access, y formatos de texto.
Trabaja con una gran variedad de gráficos: fiebres, barras, barras apiladas, tartas, ta-
blas, mapas con polígonos, líneas o puntos, etc.
Publicación de gráficos interactivos.
Combinación de diversas fuentes de datos en una sola vista.
Los datos son públicos.
Descarga de datos en crudo desde las mismas visualizaciones.
2.3.3 Many eyes
TIPO. Aplicación Web
TECNOLOGÍA. Java, Flash
LICENCIA. De uso libre
ENLACES.
Sitio web. http://www-958.ibm.com/software/data/cognos/manyeyes
Aplicación web para crear, compartir y discutir la representación gráfica de los datos de usuario
cargados.
Esta herramienta de visualización de datos gratuita ha sido puesta a disposición de los usuarios
por parte de la empresa IBM.
Many Eyes permite compartir las visualizaciones creadas fomentando las conversaciones
alrededor de una visualización y proponiendo otros enfoques a partir de los mismos datos. Se
trata de una herramienta de uso público, es decir, que todos los datos y visualizaciones que se
realicen estarán a disposición del resto de usuarios; no se puede usar de forma privada.
document.docx 8
Permite realizar gran cantidad de tipos de visualizaciones:
Relaciones entre puntos (Scatterplot, matriz de gráficos y diagramas de red).
Comparar valores (gráficos de barras, histogramas y gráficos de burbuja).
Traceo de cambios de tendencia en el tiempo (gráficos de líneas, barras y barras por
categorías).
Ver partes de totales (gráficos de queso, mapas de secciones simples y con compara-
ciones).
Analizadores de texto (árbol de conceptos, nube de etiquetas, relaciones de frase y ge-
nerador de nubes de palabras).
Gráficos geográficos (gráficos sobre mapas).
Uno de los ejemplos más famosos donde se puede ver el potencial de esta herramienta es el
discurso de Obama sobre el trabajo en forma de árbol y nube de palabras (http://www-
958.ibm.com/software/data/cognos/manyeyes/visualizations/word-tree-for-president-
obamas-job).
2.3.4 CartoDB
TIPO. Aplicación Web
TECNOLOGÍA. JavaScript, base de datos Open Source PostgreSQL y su extensión
geoespacial PostGIS.
LICENCIA. Comercial
ENLACES.
Sitio web. http://www.cartodb.com
Tutoriales. http://vimeo.com/channels/cartodb
Blog CartoDB. http://blog.cartodb.com/
Blog Vizzuality. http://blog.vizzuality.com/
Repositorio GitHub. https://github.com/Vizzuality
Base de datos geoespacial en la nube, que funciona con los servicios web de Amazon por
detrás, permitiendo la escalabilidad, la flexibilidad y la elasticidad de sus servicios. Es un
proyecto Open Source que también se ofrece como un servicio bajo demanda.
La finalidad de CartoDB es facilitar la creación de aplicaciones geolocalizadas y la creación de
document.docx 9
mapas. Permite diseñar y desarrollar mapas en tiempo real que funcionan en todas las
plataformas web y móviles.
Entre sus características podemos destacar:
Diseño de mapas: Para sus capas de datos, es posible utilizar CartoCSS para editar fá-
cilmente el formato y la apariencia con la que se generan.
Integración con otros servicios cartográficos (Google Maps, MapBox): CartoDB produ-
ce las capas de datos, y para la capa de mapa utiliza GoogleMaps y, desde la versión
2.0 MapBox. Estos mapas incluyen las funciones básicas de zoom, desplazamiento,
etc.
Integración con otras librerías: CartoDB cuenta ya con varias librerías a su alrededor
que permiten extender su uso o integrar otros servicios.
Geocodificación: Es posible obtener información geográfica a partir de otros elemen-
tos distintos de las coordenadas.
Capacidad de importar datos fácilmente: CartoDB permite introducir datos directa-
mente en las tablas a partir de su panel, añadir datos vía SQL o lectura desde URLs,
pero también se pueden importar colecciones de datos directamente en múltiples for-
matos.
Realizar peticiones SQL con componentes espaciales: Gracias al uso de PostGIS, Carto-
DB permite consultar y combinar conjuntos de datos utilizando los datos geoespacia-
les para realizar la combinación.
Tablas públicas y privadas: Como corresponde a un servicio cloud, CartoDB permite di-
ferenciar entre un uso de las tablas público, o un uso privado.
Está orientado a desarrolladores sin experiencia en sistemas de información geoespacial, con
una interfaz muy amigable.
Entre sus clientes se cuentan diversas instituciones tales como ONU, Google, la NASA, la
Universidad de Oxford, de Yale, entre otros.
2.3.5 GeoCommons
TIPO. Aplicación Web y API
TECNOLOGÍA. JavaScript, Ruby
document.docx 10
LICENCIA. Varios (http://geocommons.com/help/Open_Source)
ENLACES.
Sitio web. http://geocommons.com/
Documentación de la API. http://geocommons.com/api/
Plataforma geoespacial de gestión de datos, visualización, creación de mapas y análisis
espacial.
Admite la carga de datos desde distintos tipos de fuentes de datos: hojas de cálculo, archivos
KML, shape, servidores de bases de datos con soporte espacial, servicios OGC como WMS y
TMS, o del repositorio público de la plataforma.
Las técnicas de representación cartográficas que permite son mapas de coropletas, de símbolos
proporcionales clasificados en intervalos y color aplicado a simbología puntual. También
destacan las funcionalidades de animación temporal. Los mapas se pueden exportar a formato
KML y los datos a formato KML, hoja de cálculo o shape, entre otros, e incrustar en una página
web.
B. Wizards, librerías, APIAmplia gama de librerías y APIs disponibles para ayudar al desarrollador a crear sus propias
visualizaciones.
2.3.6 Google Chart Tools
TIPO. Biblioteca
TECNOLOGÍA. JavaScript
LICENCIA. De uso libre
ENLACES.
Sitio web. https://developers.google.com/chart/
Galería de imágenes. https://google-developers.appspot.com/chart/interactive/
docs/gallery/
Código. https://code.google.com/apis/ajax/playground/?type=visualization/
Documentación de la API. https://google-developers.appspot.com/chart/interacti-
ve/docs/reference
Herramienta de Google Developers que permite la creación de gráficas en forma de imágenes
document.docx 11
PNG. Su funcionamiento se basa en peticiones http a una determinada url
(http://chart.apis.google.com).
Es de uso gratuito pero con ciertas limitaciones. Inicialmente, su uso estaba limitado a 50.000
peticiones por url y día, pero, actualmente este límite se sitúa en 250.000. Para evitar esta
limitación, almacenar las imágenes generadas en un servidor propio a modo de cache de
imágenes.
Dispone de una gran variedad de tipos de gráficas, los cuales vienen dados como clases de
JavaScript. Una de las ventajas que tienen este sistema de generación de gráficas es que no se
necesita instalar ningún componente en nuestro entorno o servidor, por lo que se puede
generar cada gráfica “al vuelo”.
2.3.7 JavaScript InfoVis Toolkit
TIPO. Conjunto de herramientas
TECNOLOGÍA. JavaScript, Phyton
LICENCIA. MIT
ENLACES.
Sitio web. http://thejit.org/
Repositorio GitHub. https://github.com/philogb/jit
Grupo de Google. https://groups.google.com/forum/?fromgroups#!forum/javas-
cript-information-visualization-toolkit
Biblioteca de JavaScript que proporciona herramientas para crear visualizaciones de datos
interactivas en aplicaciones web (mapas estratégicos, árboles jerárquicos, mapas relacionales,
etc.). Debido a su gran diversidad de representaciones, se adapta a cualquier necesidad del
desarrollador.
Algunas de las características más relevantes de esta librería son:
Posee diferentes tipos de representaciones de datos.
Permite interactuar con los datos en tiempo real.
Compatible con la mayoría de navegadores.
Recurso Open Source de fácil integración en desarrollos web.
Extensible.
document.docx 12
Permite combinar las visualizaciones para crear nuevas formas de visualización.
Gran velocidad de proceso para estructuras complejas.
Desde el punto de vista técnico, la representación de los datos a mostrar viene marcada por
una estructura JSON (JavaScript Object Notation) un formato ligero de intercambio de datos, el
cual se basa en dos estructuras: una colección de pares de nombre/valor (objeto, registro,
estructura, diccionario, tabla hash, etc.) y una lista ordenada de valores (vectores, listas o
secuencias), estas son estructuras universales y permite a todos los lenguajes de programación
adaptarse con facilidad.
Los casos de uso o posibilidades de esta librería son innumerables:
Desarrollo en entornos BI (Business Intelligence).
Representación de organigramas.
Mapas estratégicos en cuadros de mando (Balanced Scorecard).
Mapas estadísticos de datos.
Mapas relacionales.
2.3.8 D3.js
TIPO. Biblioteca
TECNOLOGÍA. JavaScript
LICENCIA. BSD (permite el uso del código fuente en software no libre)
ENLACES.
Sitio web. http://d3js.org/
Repositorio GitHub. https://github.com/mbostock/d3
Galería. https://github.com/mbostock/d3/wiki/Gallery
Tutoriales. https://github.com/mbostock/d3/wiki/Tutorials
Librería de JavaScript que permite crear visualizaciones complejas y gráficos interactivos.
Básicamente, la librería permite manipular documentos basados en datos usando estándares
abiertos de la web; y los navegadores pueden crear visualizaciones complejas sin depender de
un software propietario. Sus desarrollos son abiertos y pueden ser reimplementados por otros
desarrolladores. Sus posibilidades son tan amplias como la geometría misma (burbujas,
document.docx 13
diagramas Chrod, links de nodos,…)
D3 permite enlazar datos al DOM (Modelo en Objetos para la Representación de Documentos)
y aplicar transformaciones. Por ejemplo, generar una tabla HTML a partir de una serie de
números. O bien utilizar los mismos datos para crear un gráfico interactivo SVG con
transiciones e interacción.
Ejemplos.
“Caminos a la Casa Blanca” (http://elections.nytimes.com/2012/results/president/sce-
narios)
“Tamaño de la industria manufacturera china” (http://www.nytimes.com/interactive/
2013/04/08/business/global/asia-map.html)
“Aumento de las fuerzas de vigilancia en la frontera entre EEUU y México” (http://
www.nytimes.com/interactive/2013/03/01/world/americas/border-graphic.html)
“Conexiones entre los contendientes a los premios Oscars” (http://
www.nytimes.com/interactive/2013/02/20/movies/among-the-oscar-contenders-a-
host-of-connections.html)
2.3.9 Protovis
TIPO. Librería
document.docx 14
TECNOLOGÍA. JavaScript
LICENCIA. BSD
ENLACES.
Sitio web. http://mbostock.github.com/protovis/
Repositorio GitHub. https://github.com/mbostock/protovis
Librería gráfica JavaScript orientada a la realización de visualizaciones.
Proporciona al desarrollador un gran conjunto de componentes y herramientas, y otorga la
posibilidad de personalizar las visualizaciones con un control detallado.
Algunas de las características más relevantes de esta librería son:
Versatilidad prácticamente ilimitada. Se basa en el framework de la gramática de los
gráficos.
Configuración de gráficos sencillo, basado en el método de encadenamiento.
Enfocada a los gráficos estadísticos, su método de desarrollo permite, además, su uso
para visualizaciones más bien estructuradas y basadas en los datos.
Incorpora algunas funciones estadísticas como preparación de los datos.
El principal inconvenientes que presenta es que Protovis es una biblioteca pesada (pesa más
de 700 Kb), pensada para Intranets o conexiones rápidas.
2.3.10Recline.js
TIPO. Biblioteca
TECNOLOGÍA. JavaScript
LICENCIA. MIT
ENLACES.
Sitio web. http://reclinejs.com/
Repositorio GitHub. https://github.com/okfn/recline/
Biblioteca para el desarrollo de aplicaciones basadas en HTML y JavaScript. Diseñada para la
integración, por lo que es fácil de integrar en otros sitios web y aplicaciones. Orientada a
desarrolladores sin grandes conocimientos de programación, que utiliza una interfaz sencilla
document.docx 15
para la vista (y edición) de datos. Las visualizaciones se ofrecen en modo gráfico, mapa y líneas
de tiempo.
Recline funciona sobre Backbone, esta estructura provee un excelente soporte para la
construcción de aplicaciones que manejan importantes cargas de datos, utilizando modelos
para la gestión de la información y vistas para mostrarlas. Además, resulta fácilmente
extensible a través de nuevos Backends que permiten conectar una base de datos o capa de
almacenamiento.
Esta biblioteca cuenta con muchas funciones para la manipulación de bases de datos, incluida
su carga, consulta y manipulación. Consta de soporte para cargar datos de archivos CSV, Excel,
Google Docs, ElasticSearch, CouchDB y DataHub entre otros.
Provista de mecanismos de limpieza y actualización de datos mediante un sencillo script.
La biblioteca Recline consiste en tres módulos:
Modelo. Definición de la estructura de los datos, (por ejemplo: definición del dataset a
utilizar según origen y tipo de datos).
Backend. Conexión de los datos mediante el API de Recline.js directamente con el ori-
gen de datos, que puede ser una base de datos, un archivo separado con comas, etc.
Vistas. Muestra de la información obtenida y gestión en las dos instancias anteriores.
document.docx 16
C. Herramientas de visualización geoespacialHerramientas para la representación de datos geográficos.
2.3.11OpenHeatMap
TIPO. Aplicación Web y API
TECNOLOGÍA. JavaScript
LICENCIA. GPL 3
ENLACES.
Sitio web. http://www.openheatmap.com/
Repositorio GitHub. https://github.com/petewarden/openheatmap/wiki
Aplicación web capaz de convertir datos estadísticos de hojas de cálculo en mapas térmicos.
Su funcionamiento es sencillo y soporta diferentes formatos de archivos como fuente: Excel,
CVS o documentos vinculados desde Google Docs.
Los ficheros deben tener un formato concreto con una columna que indique la dirección o
posición geográfica de cada uno de los datos para poder posicionarlos.
OpenHeatMap permite compartir los mapas a través del correo o redes sociales, o también
embeberlo en una página web.
2.3.12OpenLayers
TIPO. API
TECNOLOGÍA. JavaScript
LICENCIA. BSD
document.docx 17
ENLACES.
Sitio web. http://www.openlayers.org/
Documentación. http://trac.openlayers.org/wiki/Documentation
Biblioteca de JavaScript de código abierto que permite la inclusión de un componente tipo
mapa en cualquier página web, con georeferencias.
Es una librería del lado del cliente, un visor de mapas en javascript, por lo que la descarga de
estos se realiza directamente desde el navegador a través de Ajax. No genera tráfico en el
servidor, los mapas se descargan directamente del servidor de mapas.
OpenLayers permite sobreponer distintas capas sobre una básica, añadir indicadores o puntos
en el mapa con leyendas, así como polígonos y proporciona su propio API para dibujarlos de
una manera sencilla.
Incorpora un set de controles básicos y una toolbar de controles avanzados y permite incluir los
controles necesarios haciendo uso del API.
2.3.13OpenStreetMap
TIPO. Aplicación Web y API
TECNOLOGÍA. Ruby, PostgreSQL,
LICENCIA. CC BY-SA
ENLACES.
Sitio web. http://www.openstreetmap.org/
Proyecto colaborativo de creación de mapas libres y editables.
Los mapas se crean utilizando información geográfica capturada con dispositivos GPS móviles,
ortofotografías y otras fuentes libres. Esta cartografía, tanto las imágenes creadas como los
datos vectoriales almacenados en su base de datos, se distribuye bajo licencia abierta Open
Database License (ODbL).
Los usuarios registrados pueden subir sus trazas desde el GPS y crear y corregir datos
vectoriales mediante herramientas de edición creadas por la comunidad OpenStreetMap.
OpenStreetMap utiliza una estructura de datos topológica. Los datos se almacenan en el datum
document.docx 18
WGS84 lat/lon (EPSG:4326) de proyección de Mercator. Los elementos básicos de la cartografía
OSM son:
Los nodos (nodes). Puntos que recogen una posición geográfica dada.
Las vías (ways). Lista ordenada de nodos que representa una polilínea o polígono
(cuando una polilínea empieza y finaliza en el mismo punto).
Las relaciones (relations). Grupos de nodos, caminos y otras relaciones a las que se
pueden asignar determinadas propiedades comunes. Por ejemplo, todas aquellas vías
que forman parte del Camino de Santiago.
Las etiquetas (tags). Se pueden asignar a nodos, caminos o relaciones y constan de una
clave (key) y de un valor (value). Por ejemplo: highway=trunk
Los atributos de los datos siguen un modelo más elaborado que las folcsonomías de indexación
social. La ontología de las características del mapa (principalmente el significado de las
etiquetas) se mantiene mediante una wiki.
D. Herramientas de visualización de datos temporalesHerramientas para el análisis de datos en los que el tiempo es una componente importante.
2.3.14TimeFlow
TIPO. Aplicación de escritorio
TECNOLOGÍA. Java Script
LICENCIA. Libre
ENLACES.
Sitio web.
Repositorio GitHub. https://github.com/FlowingMedia/TimeFlow/wiki
Herramienta de visualización para datos temporales. La versión actual es “alfa”, por lo que
puede contener errores.
Esta herramienta ayuda a analizar los datos temporales a través de cinco vistas diferentes:
Vista Línea de Tiempo.
Vista Calendario.
Vista Diagrama de barras.
Vista Tabla.
document.docx 19
Vista Lista.
2.4 Herramientas para el análisis de redesEste tipo de herramientas resulta de interés en el análisis de las redes sociales, en referencia a
la disciplina de encontrar conexiones entre las personas en base a varios conjuntos de datos.
Es necesario entender las teorías estadísticas del análisis de nodos de redes para usar esta
categoría de software.
2.4.1 Gephi
TIPO. Aplicación de escritorio
TECNOLOGÍA. Windows, Linux, MacOS X, Java
LICENCIA. CDDL, GPL3
ENLACES.
Sitio web. http://gephi.org/
Documentación. http://wiki.gephi.org/index.php/Main_Page/
Plataforma de exploración y visualización interactiva para todo tipo de redes y grafos
complejos, dinámicos y jerárquicos.
Permite visualizar la relación entre datos y su evolución, agrupando conjuntos, definiendo
jerarquías, exportando e importando tablas…
Tiene la particularidad que permite manejar grafos grandes, redes de hasta 50.000 nodos y un
millón de aristas.
2.4.2 NodeXL
TIPO. Aplicación de escritorio
TECNOLOGÍA. Microsoft
LICENCIA. Microsoft Public License (Ms-PL)
ENLACES.
Sitio web. http://nodexl.codeplex.com/
document.docx 20
Potente herramienta de análisis y representación de grafos que trabaja con Excel. Trabaja
mostrando gráficos de red a partir de una lista dada de conexiones, ayudando en el análisis y
descubrimiento de patrones y relaciones en los datos.
Algunas de las características más relevantes de esta herramienta son:
Importación y exportación flexible. Importación de datos desde múltiples fuentes.
Conexiones directas a las redes sociales. Optimizada para analizar medios sociales en
línea; incluyendo conexiones incorporadas para hacer query en las API de Twitter, Fli -
ckr y YouTube.
Diseño flexible.
Combinación de enlaces duplicados.
Cálculo de métricas y análisis de redes.
Inserción de imágenes de subgrafos de redes.
Automatización de tareas.
document.docx 21
3 Comparativa
A continuación se incluye un cuadro resumen en el que se presenta una comparativa con las
herramientas de visualización analizadas en el presente documento.
Herramienta CategoríaVisualización multipropósito
Tipo Tecnología Licencia PlataformaAlmacenamiento de datos
PublicaciónWeb?
DataWrangler Depuración de datos
No Aplicación Web
HTML Libre Navegador Servidor externo No
Google Refine Depuración de datos
No Aplicación de escritorio
Java BSD Navegador Local No
Mr. Data Converter
Conversor de datos
No Biblioteca JavaScript MIT Navegador Local No
The R Project for Statistical Computing
Análisis estadístico
Si Lenguaje de programa-ción
R GPL Linux, Mac OS X, Unix, Windows XP
Local No
Google Fusion Tables
Aplicación/ Servicio de visualización
Si Aplicación Web y API
JavaScript, Flash
Libre Navegador Servidor externo Si
Tableau Public Aplicación/ Servicio de visualización
Si Aplicación de escritorio
Windows, JavaScript
Libre Windows Servidor público externo
Si
Many eyes Aplicación/ Servicio de visualización
Si Aplicación Web
Java, Flash Libre Navegador Servidor público externo
Si
CartoDB Aplicación/ Servicio de visualización
Si Aplicación Web
JavaScript, PostgreSQL
Comer-cial
Navegador Servidor externo Si
GeoCommons Aplicación/ Servicio de visualización
Si Aplicación Web y API
JavaScript, Ruby
Varios Navegador Servidor local o externo
Si
Google Chart Tools
Librería y servicio de visualización
Si Bibioteca JavaScript Libre Editor de código y navegador
Servidor local o externo
Si
JavaScript InfoVis Toolkit
Librería Si Conjunto de herramien-tas
JavaScript, Phyton
MIT Editor de código y navegador
Servidor local o externo
Si
D3.js Librería Si Biblioteca JavaScript BSD Editor de código y navegador
Servidor local o externo
Si
Protovis Librería Si Biblioteca JavaScript BSD Editor de código
Local No
Recline.js Librería Si Biblioteca JavaScript MIT Editor de código
Servidor local o externo
No
OpenHeatMap GIS No Aplicación Web y API
JavaScript GPL 3 Navegador Servidor externo Si
document.docx 22
OpenLayers GIS No API JavaScript BSD Editor de código y navegador
Servidor externo Si
OpenStreetMap GIS No Aplicación Web y API
Ruby, PostgreSQL
CC BY-SA
Navegador o equipos de escritorio que ejecutan Java
Servidor local o externo
Si
TimeFlow Análisis de datos temporales
No Aplicación de escritorio
JavaScript Libre Equipos de escritorio que ejecutan Java
Local No
Gephi Análisis de redes
No Aplicación de escritorio
Windows, Linux, MacOS X, Java
CDDL, GPL3
Equipos de escritorio que ejecutan Java
Local Como imagen
NodeXL Análisis de redes
No Aplicación de escritorio
Microsoft Microsoft Public License (MS-PL)
Excel 2007 y 2010 en Windows
Local Como imagen
document.docx 23
4 Conclusiones finales
Como conclusión general, ante la gran cantidad y diversidad de herramientas de visualización
gratuitas existentes en el mercado se puede inferir que estamos ante un periodo de gran
proliferación de datos en bruto, en el que existe un creciente interés por encontrar la manera
más adecuada de presentar esta información de manera atractiva, clara, concisa y
comprensible para el usuario final.
Herramientas de visualización de datos e información hay muchas. A continuación se presentan
las que se consideran más recomendables en base a las capacidades aportadas y al nivel de
experiencia requerido.
En la categoría de aplicaciones Web, destacan:
o Google Fusion Tables.
Herramienta excelente para los principiantes o para aquellas personas que no
saben de programación. De todas formas, para los usuarios más avanzados
existe una API que permite producir gráficas o mapas a partir de información.
Una de las ventajas de esta aplicación es la diversidad de representaciones de
datos que se ofrecen a disposición del usuario. Además, ofrece una creación de
gráficos o mapas relativamente rápida, incluyendo funciones GIS para analizar
datos por geografías. El servicio automáticamente establece direcciones de
códigos geográficos, lo cual es útil cuando se intenta colocar muchos puntos en
un mapa.
Google permite designar los datos como privados o no listados o públicos, a
pesar de que los datos aún residen en los servidores de Google, lo cual se
convierte en un inconveniente, teniendo en cuenta el problema de la
privacidad de los datos.
o CartoDB.
Servicio Open Source dirigido a cualquier usuario, independientemente del
nivel técnico que tenga, con una interfaz muy amigable.
Destaca su activo grupo de desarrolladores que aporta gran cantidad de
documentación y ejemplos. El carácter abierto de su API hace que
document.docx 24
continuamente se están desarrollando nuevas integraciones y aumentando las
capacidades de la herramienta, con nuevas librerías.
Entre sus clientes se cuentan diversas instituciones tales como ONU, Google, la
NASA, la Universidad de Oxford, de Yale, entre otros.
El empleo de librerías y APIs permiten al desarrollador crear visualizaciones a medida,
según las necesidades del proyecto.
o Google Chart Tools.
Esta API tiene dos modos de funcionamiento, los gráficos estáticos mediante
imágenes (más sencilla) y gráficas interactivas (más potente).
La generación de gráficos estáticos mediante imágenes es fácil de usar,
obteniendo los gráficos mediante una petición a los servidores de Google, y
ofrece gran variedad de tipos de gráficas y opciones. Presenta la herramienta
Live Chart Playground, que permite generar urls de gráficas para incrustar en
nuestro código html, así como previsualizar las modificaciones en los
parámetros en tiempo real. Además, no es necesario instalar ningún
componente en nuestro entorno o servidor, generando las gráficas “al vuelo”.
El modo de generación de gráficas interactivas, mediante una librería
JavaScript, es más completo y permite generar gráficos funcionales. El
problema radica en que, como ocurre con otras librerías de JavaScript, se hace
necesaria la programación de código.
Es de uso gratuito pero con ciertas limitaciones de peticiones por url y día,
actualmente este límite se sitúa en 250.000.
o Recline.js.
Esta librería resulta sencilla de usar por aquellos usuarios que no tengan
grandes conocimientos de programación.
Es considerada una biblioteca versátil debido a su modularidad. Esto significa
que sólo vas a utilizar aquellos módulos que necesites para construir tu
aplicación.
Otra de sus ventajas, es que sus vistas pueden ser embebidas en otras
document.docx 25
aplicaciones, exactamente como han hecho para CKAN y el DataHub.
Entre las herramientas disponibles para la representación de datos geográficos, se des-
taca:
o OpenLayers.
Librería muy potente que requiere profundizar en conocimientos de GIS. La
gran ventaja es que no requiere el uso de licencias como Google maps.
Resulta una opción interesante para aquellos usuarios que están
acostumbrados a programar en JavaScript y prefieren no usar una plataforma
comercial como Google o Bing. Es totalmente compatible con tecnologías
propietarias además de cumplir con los estándares WMS y WFS.
Permite un enorme abanico de posibilidades: importar marcas en formato
KML, marcar polígonos con islas, posicionar marcas con el parseo de rss,
integración con jQuery Mobile, añadir animaciones a los polígonos para
representar, por ejemplo, una trayectoria,...
document.docx 26
Recommended