111
UNIVERSIDAD DE GRANADA FACULTAD DE CIENCIAS DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA MASTER EN ESTADÍSTICA APLICADA HERRAMIENTAS PARA LA ENSEÑANZA EN ENTORNOS VIRTUALES Y LA INTERFAZ GRÁFICA RKWARD Trabajo Final de Máster realizado por: Sara Fernández Corral y dirigido por la profesora: Dra.Dña. Yolanda Román Montoya

Herramientas Para La Enseñanza en Entornos Virtuales y La Interfaz Gráfica RKWARD

Embed Size (px)

DESCRIPTION

Herramientas sobre entornos virtuales de aprendizaje

Citation preview

  • UNIVERSIDAD DE GRANADA

    FACULTAD DE CIENCIAS

    DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN OPERATIVA

    MASTER EN ESTADSTICA APLICADA

    HERRAMIENTAS PARA LA ENSEANZA EN ENTORNOS

    VIRTUALES Y LA INTERFAZ GRFICA RKWARD

    Trabajo Final de Mster realizado por:

    Sara Fernndez Corral

    y dirigido por la profesora:

    Dra.Da. Yolanda Romn Montoya

  • ndice

    Curso virtual de RKWard | 3

    ndice

    1. Introduccin a entornos virtuales de enseanza ............................................................................. 5

    1.1 Entornos virtuales para la enseanza: Moodle ................................................................. 6

    1.2 Caractersticas de Moodle ................................................................................................ 8

    1.3. Implementacin de una plataforma Moodle ................................................................. 13

    2. Introduccin a RKWard .................................................................................................................. 15

    2.1. Inicio del interfaz ............................................................................................................ 15

    2.2. rea de trabajo .............................................................................................................. 17

    2.3. Sintaxis ........................................................................................................................... 18

    2.4. Consola de R y editor de Scripts ..................................................................................... 20

    2.5. Ayuda ............................................................................................................................. 22

    2.6. Instalacin de libreras ................................................................................................... 25

    2.7. Funciones disponibles en RKWard ................................................................................. 28

    2.7.1. Analysis ........................................................................................................... 28

    2.7.2. Plots ................................................................................................................ 29

    2.7.3. Distributions ................................................................................................... 31

    3. Carga de datos en RKWard ............................................................................................................ 33

    3.1. Lectura de datos desde un fichero externo .................................................................... 33

    3.2. Ficheros de datos de SPSS .............................................................................................. 34

    3.3. Fichero de texto plano o formato CSV ........................................................................... 35

    3.4.Carga manual de datos .................................................................................................... 39

    3.5.Definicin de variables de un conjunto de datos ............................................................ 42

    4. Grficos .......................................................................................................................................... 47

    4.1. Diagrama de barras (Bar Plot) ........................................................................................ 48

    4.2. Diagrama de cajas (BoxPlot) ........................................................................................... 51

  • ndice

    Curso virtual de RKWard | 4

    4.3. Histograma ..................................................................................................................... 53

    4.4. Diagrama de sectores (Piechart) .................................................................................... 55

    4.5. Grfico de Pareto ........................................................................................................... 56

    4.6. Diagrama de dispersin .................................................................................................. 59

    4.7. Matriz de diagramas de dispersin ................................................................................ 60

    5. Anlisis ........................................................................................................................................... 63

    5.1. Estadsticos descriptivos ................................................................................................. 63

    5.2.Correlacin ...................................................................................................................... 69

    5.2.1. Matriz de correlaciones .................................................................................. 70

    5.2.2. Grfico de Matriz de correlaciones ................................................................. 72

    5.3.Tablas de contingencia .................................................................................................... 74

    6. Inferencia ....................................................................................................................................... 77

    6.1.Contrastes paramtricos ................................................................................................. 78

    6.1.1.t-Test para el contraste de medias .................................................................. 78

    6.1.2.Test de Bartlett ................................................................................................ 83

    6.1.3.Test F ............................................................................................................... 84

    6.2.Contrastes no paramtricos ............................................................................................ 86

    6.2.1.Test de Wilcoxon ............................................................................................. 86

    6.3.Pruebas de normalidad ................................................................................................... 90

    6.3.1.Prueba de Lilliefors .......................................................................................... 92

    6.3.2.Prueba de normalidad de la 2 de Pearson ...................................................... 92

    7. Anlisis de Distribuciones .............................................................................................................. 95

    7.1. Funcin de distribucin .................................................................................................. 96

    7.2. Funcin cuantil ............................................................................................................... 98

    7.3. Grficos .......................................................................................................................... 99

    7.4. Teorema central del lmite ........................................................................................... 103

    Anexo I. Instalacin de RKWard ....................................................................................................... 107

    Bibliografa ....................................................................................................................................... 111

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 5

    1. Introduccin a entornos virtuales de enseanza

    La sociedad de hoy en da est en continua evolucin, lo que hace necesario una contina

    formacin, tanto para mantenerse en el mercado laboral, como en comunidades docentes y de

    investigacin. La expansin que en los ltimos aos han tenido las nuevas tecnologas han

    favorecido la creacin de un nuevo espacio social-virtual, que permite el desarrollo de la educacin

    facilitando nuevos procesos de aprendizaje y transmisin de conocimientos a travs de redes

    modernas de aprendizaje. El desarrollo de este tipo de espacio social y virtual incita el desarrollo de

    un nuevo sistema docente que sustituye a las clases ordinarias, (entendindose como tales, las

    impartidas por profesores en aulas cuyos oyentes o participantes son los alumnos), que elimina los

    inconvenientes de disponibilidad horaria e incluso geogrfica. Los cursos virtuales son una

    herramienta cada vez ms utilizada y demandada en el mbito educativo. Nos encontramos

    inmersos en una poca donde el ansia de conocimiento y formacin son cada vez mayores. Esto

    hace que un sujeto no finalice su formacin en el momento en el que encuentra un trabajo sino que

    intente compaginarlo con cursos, master, y la forma ms apropiada para que esto se cumpla es a

    travs de entornos virtuales.

    La utilizacin de estos entornos virtuales es posible gracias a la generalizacin del uso de las nuevas tecnologas por la mayor parte de la poblacin. Segn la ltima Encuesta sobre Equipamiento y Uso de Tecnologas de Informacin y Comunicacin en los Hogares del ao 2011 publicada recientemente por el Instituto Nacional de Estadstica (en adelante INE), el 71,5% de los hogares con al menos un miembro de 16 a 74 aos dispone de ordenador y el 63,9% de los hogares espaoles dispone de acceso a Internet.

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 6

    Ilustracin 1. Evolucin del equipamiento TIC en los hogares. Fuente: INE

    Adems en los ltimos aos se ha extendido el uso de las redes sociales, prueba de ellos es que se ha investigado por primera vez en esta encuesta. El 52,3% de los usuarios de Internet ha participado en redes sociales en los ltimos tres meses, tales como Facebook o Twitter. Sin duda los jvenes (de entre 16 a 24 aos) y los estudiantes son los ms participativos, con un 88,5% y un 90,2% de participacin respectivamente.

    1.1 Entornos virtuales para la enseanza: Moodle

    En este trabajo presentaremos herramienta Moodle como software para la creacin de cursos y sitios Web.

    Ilustracin1.1 Enlace a la web de Moodle

    0

    10

    20

    30

    40

    50

    60

    70

    80

    2004 2005 2006 2007 2008 2009 2010 2011

    Evolucin del equipamiento TIC en los hogares

    (% de hogares)

    Algn tipo de ordenador Disponen de acceso a Internet

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 7

    Moodle, cuyas siglas significan Modular Object-Oriented Dynamic Learning Environment (Entorno de Aprendizaje Dinmico Orientado a Objetos y Modular), es un proyecto dirigido por Martin Dougiamas, que fue su creador y quien comenz con su desarrollo. Dado que se trata de un software de cdigo abierto se mantiene en constante evolucin gracias a la aportacin de distintos desarrolladores, y permite realizar cambios para adecuarlo a las necesidades de cada curso.

    Se trata de un software libre que se distribuye de forma gratuita bajo la licencia pblica GNU, y que puede funcionar en cualquier ordenador que permita ejecutar el lenguaje de programacin PHP. El programa est disponible para su descarga en la pgina web moodle.org, donde adems podremos encontrar multitud de informacin sobre la herramienta. La pgina web pretende ser un punto de encuentro para los usuarios de Moodle, ya que dispone de diferentes foros de discusin donde tanto administradores de sistemas, profesores, investigadores, diseadores de formacin y desarrolladores participan aportando sus experiencias con el software y aportando soluciones a otros usuarios, lo cual hace que la pgina web se encuentre en continuo desarrollo al igual que Moodle.

    Las principales ventajas que hacen que nos inclinemos hacia el uso de esta herramienta son las siguientes:

    Moodle es apropiado tanto como complemento para cursos tradicionales de enseanza presencial, como para la realizacin de cursos online, ya que permite realizar entornos virtuales de enseanza que estarn disponibles a travs de Internet.

    Es fcil de instalar en casi cualquier plataforma que soporte PHP y su uso es muy intuitivo con lo cual no necesitar formacin complementaria para mostrar a los usuarios finales su manejo.

    Moodle es capaz de soportar comunidades de cientos de miles de estudiantes y de soportar cientos de cursos en una misma plataforma. Adems no es una plataforma cerrada, ya que una vez sta haya sido instalada se podr seguir aadiendo nuevos cursos de manera sencilla. La mayor instalacin de Moodle actualmente en servicio (Open Polytechnic de Nueva Zelanda) maneja un total de ms de 45.000 estudiantes y tiene registrados ms de 6.500 cursos.

    Existen paquetes de idiomas que permiten traducir de manera sencilla la plataforma a distintos idiomas. Actualmente es posible traducir Moodle a 70 idiomas.

    Moodle permite realizar un seguimiento exhaustivo de los usuarios, los que permite suplir las carencias de la enseanza online respecto de la enseanza presencial. Se dispone de informes de actividad para cada estudiante.

    Aunque la mayor parte de comunidades de enseanza tendrn los recursos suficientes para hacer la instalacin de la plataforma Moodle en sus propios servidores, existen diversos servidores gratuitos que permiten alojar nuestra propia plataforma Moodle. Entre los servidores disponibles se encuentran los siguientes:

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 8

    Moodlefarm.socialminds

    KeyToSchool

    Ilustracin 1.2 Enlace al servidor gratuito Key To School

    Para la plataforma que hemos creado como material adicional a este trabajo hemos usado este

    ltimo, ya que adems de ofrecernos alojamiento gratuito, al registrarnos nos simplifica nuestro

    trabajo realizando una instalacin bsica de Moodle en el servidor. Otra ventaja que ofrece

    KeyToSchool es que nos ofrece la posibilidad de usar o bien dominios web propios que tengamos

    registrados anteriormente o crear uno nuevo utilizando uno de los disponibles que nos ofrecen.

    En ltimo apartado introduciremos la plataforma creada para este trabajo.

    1.2 Caractersticas de Moodle

    Como hemos indicado anteriormente Moodle puede albergar un gran nmero de cursos en el

    mismo servidor. Moodle permite clasificar los por categoras, adems de mostrar una descripcin

    de cada unos de los cursos.

    Ya que Moodle es usado para la creacin de plataformas de enseanza online, dispone de

    herramientas para hacer un seguimiento del curso de manera fcil. Para los profesores dispone de

    informes de actividad de cada usuario, permitiendo conocer el grado de implicacin del estudiante

    con el curso, mostrando las participaciones del estudiante en los diferentes mdulos, actividades

    entregadas, participaciones en foros y chats. Para facilitar el seguimiento del curso al estudiante en

    la pgina principal del curso se pueden presentar los cambios ocurridos en ste desde su ltimo

    acceso.

    Por defecto, Moodle permite configurar diferentes tipos de actividades en los cursos, adems

    tambin subir a la plataforma actividades programadas por los propios usuarios. A continuacin se

    describen brevemente los principales mdulos disponibles para incluir en la plataforma.

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 9

    Mdulo Recurso

    Este tipo de mdulo permite la presentacin de todo tipo de archivos como pueden ser archivos

    tipo Word, Power Point, videos y sonidos Estos mdulos se podrn usar para subir los contenidos

    propios del curso, por ejemplo un archivo pdf con el contenido terico del curso.

    Adems permitir enlazar contenidos externos en web o incluirlos en la plataforma del curso.

    Ilustracin 1.2.1. Ejemplo de recurso de archivo pdf

    Una vez hayamos elegido la opcin del recurso que quedamos visualizar, ste aparecer de la

    siguiente manera:

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 10

    Ilustracin 1.2.2 Visualizacin del recurso

    Mdulo de Tareas

    Utilizaremos este modulo para incluir tareas o ejercicios que deben realizar los alumnos del curso y

    que ms tarde el profesor podr calificar. Una vez realizada la tarea por el alumno, ste podr subir

    la tarea en cualquier formato de archivo.

    El profesor o administrador del curso podr especificar una fecha final de entrega de la tarea, y

    podr configurar la tarea tanto para que no se pueda entregar sta fuera de la fecha lmite o bien

    se podr permitir el envo de tareas fuera de tiempo. En ambos casos se mostrar la fecha en la que

    el alumno subi la tarea, permitiendo al profesor ver si est fue entregada dentro del lmite

    establecido.

    El profesor tiene la posibilidad de adjuntar observaciones a la tarea enviada por el alumno,

    adjuntadas a la pgina de la tarea de cada estudiante, y se enviar una notificacin al alumno.

    Adems se da la posibilidad al profesor de permitir al alumno el reenvo de las tareas despus de la

    calificacin para volver a calificarla.

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 11

    Ilustracin 1.2.3 Visualizacin de tarea

    Mdulo Foro

    Este tipo de mdulos permiten la forma ms clara de interactuacin de los usuarios dentro de la

    plataforma, aunque estos no estn conectados al mismo tiempo. Permiten realizar al alumno

    consultas, por ejemplo consultar dudas acerca de los cursos, y no solamente podr contestarle el

    profesor, sino que podrn ser los otros alumnos del curso quienes puedan ofrecer la respuesta a la

    consulta realizada. Esto permite crear adems debates sobre diferentes aspectos del curso.

    Respecto a la configuracin de los foros del curso, el profesor podr realizar la suscripcin

    obligatoria de todos los alumnos al foro o dar libertad a los alumnos para suscribirse a los foros que

    les interesen, adems podrn elegir la opcin de que se les enven correos electrnicos con copias

    de los mensajes del foro.

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 12

    Ilustracin 1.2.4 Visualizacin de foro

    Mdulo de Chat

    A diferencia de los foros, los chats requieren que los usuarios estn conectados al mismo tiempo.

    Este mdulo puede ser utilizado para tutoras individuales entre el profesor y el alumno o bien para

    tutoras colectivas, en ambos casos lo ms adecuado ser que el profesor establezca una fecha

    concreta para el encuentro.

    Adems en el caso de que un alumno no pudiera participar en el chat, podr consultar la sesin ya

    que todas estas quedan registradas y podrn ser puestas a disposicin de los estudiantes.

    Mdulo Cuestionario

    Se podrn crear cuestionarios que podrn ser contestados por los alumnos que sern calificados

    automticamente. Las preguntas podrn configurarse de diferente forma, entre otras opciones las

    respuestas podrn ser de tipo respuesta corta (palabras o frases), de tipo verdadero o falso o de

    tipo numrico.

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 13

    Ilustracin 1.2.5 Visualizacin de foro

    1.3. Implementacin de una plataforma Moodle

    Como complemento a este trabajo que pretende introducir al usuario en las herramientas para la

    creacin de entornos virtuales de enseanza y en herramientas para la docencia e investigacin de

    la estadstica, se ha creado una plataforma Moodle que incluye un curso virtual para la iniciacin

    en el manejo de la interfaz grfica RKWard.

    Dicha plataforma se ha alojado en el servidor gratuito Key To School, a la que podr acceder a

    travs del siguiente enlace.

    http://www.tmfcursovirtualrkward.moodlehub.com/

    A la cual se podr acceder mediante el usuario de prueba que se indica a continuacin o bien

    mediante el acceso como invitado.

    Usuario: estudiante

    Password: Estudiante_1

  • 1. Introduccin a entornos virtuales de enseanza

    Curso virtual de RKWard | 14

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 15

    2. Introduccin a RKWard

    Se presenta en este trabajo la herramienta computacional para la realizacin de anlisis estadsticos denominada RKWard, una interfaz grfica para el entorno de programacin y computacin estadstica R.

    Aunque R resulta ser un potente lenguaje de programacin para desarrollos estadsticos, su manejo

    requiere de un amplio conocimiento del leguaje de programacin que lo sustenta, lo que puede

    complicar su uso a usuarios no avanzados. RKWard viene a cubrir esta desventaja, ya que permite

    realizar desde los anlisis estadsticos ms simples hasta los ms complejos con tan solo navegar a

    travs de los mens del interfaz. RKWard tambin permite generar anlisis mediante la forma

    habitual de lneas de comando utilizada en R. Aunque R dispone de otros interfaces grficos de

    caractersticas similares a RKWard, como es R Commander, un profundo anlisis de las

    caractersticas de ambas libreras ha hecho que nos decantemos por la opcin que aqu

    presentamos, RKWard, y que desarrollaremos a lo largo de los diferentes captulos del trabajo.

    El interfaz RKWard se distribuye de forma gratuita, bajo licencia GPL de GNU, est programado en C++ y PHP y utiliza las bibliotecas del entorno grfico KDE. Al igual que R, se trata de un software que est en constante actualizacin, ya que se desarrolla a partir de las aportaciones de los usuarios. Prueba de ello es que aunque originalmente se program para que funcionase sobre Ubuntu, las versiones que actualmente se estn desarrollando y funcionan sobre Windows cada vez estn ms completas y son ms estables.

    En el Anexo I se da un pequeo manual de instalacin, ya que al contrario que R Commander que se instala nicamente cargando la librera correspondiente, RKWard requiere otro tipo de instalacin.

    En las siguientes secciones del captulo procederemos a la presentacin de las diferentes partes y opciones de RKWard.

    2.1. Inicio del interfaz

    Una vez tengamos instalado correctamente RKWard, lo iniciaremos pulsando sobre el icono del acceso directo que habremos creado. Al iniciar el programa se nos mostrar la siguiente ventana, donde se nos da la bienvenida al programa y se nos ofrece distinta informacin acerca del programa, entre la que se encuentran dos manuales, uno para usuarios principiantes y otra para usuarios habituales de R:

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 16

    Ilustracin 2.2.1.1 Pantalla inicial

    Si hacemos una vista general el interfaz del programa, esta se divide en diferentes partes.

    En la parte superior aparece la barra de mens. A travs de ellos podemos cargar datos desde diferentes tipos de archivos o ficheros de sesiones anteriores que hayamos salvado, se dispone de opciones para editar tanto los ficheros de datos como las ventanas de resultados, opciones de anlisis y de ayuda sobre RKWard.

    En la columna de la izquierda e se muestra el navegador del rea de trabajo que permite ver y manipular objetos de R, tales como datos, funciones, etc.

    La parte central de la ventana de RKWard es la denominada rea de trabajo, en este espacio se visualizarn los conjuntos de datos, scripts que programemos y se mostrarn los resultados. En la parte superior del rea de trabajo irn apareciendo diferentes pestaas que nos permitirn pasar de una ventana a otra.

    Por ltimo, en la barra inferior, se nos da acceso al historial de comandos (Command log), la lista de trabajos pendientes, la consola de R y un buscador de ayuda.

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 17

    2.2. rea de trabajo

    El rea de trabajo es el espacio situado en la parte central de la ventana de RKWard, que ocupa la mayor parte de esta. En este espacio se muestran los conjuntos de datos, la documentacin de ayuda y lo que es ms importante los resultados de los anlisis y grficos que vayamos generando.

    Una ventaja importante de RKWard es que guarda el histrico de todos los anlisis o grficos que se van realizando. Una vez hayamos realizado la primera operacin se abrir la ventana llamada Output rk out.html donde aparecern los resultados que hayamos generado anteriormente. Tambin podremos abrir dicha ventana pulsando Windows->Show Output.

    Ilustracin 2.2.1 Salida de resultados

    Si en algn momento quisiramos recuperar alguno de los anlisis o cargar datos utilizados anteriormente, simplemente deberemos pulsar el enlace Run again y se abrir de nuevo el cuadro de dilogo donde podremos hacer las modificaciones que deseemos y volver a ejecutar, generando otra nueva salida.

    Una de las grandes ventajas que tiene RKWard respecto de otros interfaces de R o de la consola de R es la forma de presentacin de los resultados, como ya hemos indicado estos se van mostrando en la ventana Output rk out.html de forma separada de la sintaxis, pero lo que realmente

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 18

    diferencia a RKWard es que los resultados son generados en formato HTML, lo que hace ms agradable su presentacin.

    En las siguientes ilustraciones mostramos dos ejemplos para su comparacin, el primero est realizado con RKWard mientras que el segundo se ha realizado con R Commander.

    Ilustracin 2.2.2 Salida de RKWard

    Ilustracin 2.2.3 Salida de R Commander

    2.3. Sintaxis

    Aunque como hemos dicho ya en innumerables ocasiones la principal ventaja de la utilizacin de este interfaz es que no necesitamos conocer el lenguaje de programacin usado por R, en ocasiones nos ser til tener el cdigo que hay detrs de las operaciones que estamos realizando, como puede ser crear procesos automatizados o simplemente ir familiarizndonos con dicho

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 19

    cdigo. RKWard realiza las operaciones con cdigo abierto y ofrece distintas posibilidades para examinarlo:

    El procedimiento ms elemental para obtener el cdigo asociado a cada una de las rdenes que se estn ejecutanto es la utilizacin del botn Code. En cada uno de los cuadros de dilogo asociados a las diferentes opciones de la barra de mens de RKWard aparecer un botn identificado como Code, si pulsamos sobre l, la ventana del cuadro de dilogo se expandir y en el recuadro inferior aparecer el cdigo para generar tanto el resultado como la presentacin del resultado.

    Ilustracin 2.3.1 Sintaxis de R

    Por otra parte, si en lugar de ir copiando cada uno de los cdigos generados queremos obtener el cdigo de varias funciones a la vez, o bien se nos olvid copiar el cdigo antes de darle a ejecutar,

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 20

    podemos ir al historial de comandos pulsando el botn Command log que se encuentra en la parte inferior de la ventana del programa. En el espacio que se abrir al pulsar el botn aparecer el cdigo que se ha ido generando a lo largo de la sesin.

    Ilustracin 2.3.2 Histrico de comandos

    2.4. Consola de R y editor de Scripts

    Aunque la principal ventaja de RKWard es que podemos realizar los anlisis mediante las funciones del men, habr ocasiones en las que nos ser til utilizar la consola de R o bien, si se trata de algn anlisis ms complicado y que queramos recuperar ms tarde, podremos hacer uso del editor de scripts.

    Como ya vimos al principio de esta introduccin en la parte inferior de la pantalla podemos invocar un emulador de la consola de R, sta funciona en casi todos sus aspectos de la manera habitual, por lo que habr que tener ciertos conocimientos previos de R para poder ejecutar las funciones.

    Para acceder al editor de scripts lo haremos mediante el men File->New->Script File o bien pulsando el botn del men Create-> Script File, lo cual har que se nos habr un editor en blanco donde podremos ir escribiendo nuestros comandos, que luego ejecutaremos mediante las

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 21

    diferentes opciones que nos da el men Run, como son ejecutar el cdigo seleccionado, ejecutar todo el cdigo

    Entre las ventajas ms destacables que ofrece tanto el editor de scripts como la consola que incluye RKWard se incluyen:

    Resaltado de la sintaxis. Esto ya ocurre en otros editores de scripts disponibles, como pueden ser Tinn-R o R-Studio, pero no en la consola.

    Ilustracin 2.4.1 Resaltado de la sintaxis

    Completar sintaxis. Mientras estamos escribiendo el nombre de alguna funcin o smbolo de R aparecern las diferentes opciones disponibles, mediante las flechas del teclado podremos seleccionar la que estamos buscando y pulsando el intro se completar el nombre de la funcin u objeto.

    Ilustracin 2.4.2 Completado la sintaxis

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 22

    Lista de argumentos de la funcin. Mientras tecleamos la llamada a la funcin, se nos mostrarn en una caja la lista de argumentos de la funcin.

    Ilustracin 2.4.3 Listado de argumentos de la funcin

    Bsqueda rpida. Podremos buscar ayuda sobre una funcin u objeto de R si mientras mantenemos el cursor sobre este presionamos F2. Tambin tenemos disponible el men Help.

    2.5. Ayuda

    RKWard dispone de multitud de documentacin de ayuda. RKWard ofrece acceso a la documentacin de R de diferentes formas adems de las habituales en R de escribir el nombre de la funcin u objeto que se quiere consulta entre parntesis precedido de la orden help o bien sin parntesis y con un signo de interrogacin delante.

    En RKWard podremos acceder a la ayuda disponible de R tambin a travs del men Help, en el que encontramos diferentes opciones. La opcin Help on R que nos lleva a la pgina principal de R donde podemos encontrar diferente informacin sobre R, sus paquetes, funciones, etc. Otra opcin para la bsqueda de ayuda es Search R Help, a la que se podr acceder mediante el men Help o bien desde la barra inferior pulsando el botn Help search. Si bien pulsamos el botn Help search o elegimos el camino del men se nos mostrar la siguiente ventana en la parte inferior del interfaz:

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 23

    Ilustracin 2.5.1 Buscador de ayuda

    En esta ventana podremos introducir bien el nombre completo de la funcin de R que queremos buscar, bien algunas de las letras de la funcin a partir de las cuales se desplegar una lista de funciones que contengan la palabra o letras introducidas. Una vez hayamos elegido de la lista mostrada la funcin deseada, se abrir en el espacio de trabajo una nueva pestaa con la ayuda de la funcin solicitada.

    Como bien hemos indicado en varias ocasiones la principal ventaja de RKWard es que se pueden realizar anlisis desde las funciones contenidas en el men. En la mayora de estas habr que introducir ciertos parmetros, o modificar los que vengan por defecto, para que la funcin se ajuste al anlisis que queremos hacer. En la mayora de los casos en cada funcin podremos acceder a una ayuda donde se nos indicar adems de para qu sirve la funcin escogida, las diferentes opciones y parmetros a introducir. Para acceder a esta ayuda pulsaremos el botn Help en la ventana de la funcin.

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 24

    Ilustracin 2.5.2 Botn de ayuda

    Ilustracin2.5.3 Documentacin de ayuda

    En algunas ocasiones, adems de la opcin mostrada anteriormente se da la opcin de utilizar un asistente a travs del cual se indican los diferentes pasos a seguir as como los parmetros que se deben introducir, acompaados de pequeos textos a modo de explicacin. Para usar esta situacin, cuando est disponible, pulsaremos el botn Use Wizard.

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 25

    Ilustracin 2.5.4 Asistente

    En el captulo de inferencia mostraremos con ms detalle este asistente.

    2.6. Instalacin de libreras

    La instalacin de libreras en RKWard es muy sencilla, accederemos a la ventana para la carga de las libreras mediante Workspace->Load / Unload Packages o bien Setting -> Configure Packages y nos aparecer en ambos casos la ventana siguiente:

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 26

    Ilustracin 2.6.1 Configuracin de libreras

    En esta primera pestaa podremos ver las libreras que tenemos instaladas, que aparecen en la lista de la izquierda, y en la derecha aparecern aquellas que tenemos en estos momentos cargadas y listas para usar. Podremos cargar las libreras que se encuentran ya instaladas seleccionndolas de la lista de la izquierda y pulsando el botn Load y al contrario descargarlas, seleccionndolas de la lista de la derecha y pulsar Unload.

    En las dos pestaas siguientes se nos da la opcin de actualizar e instalar nuevas libreras.

    Ilustracin 2.6.2 Instalacin de libreras. Inicio

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 27

    Para instalar cualquier librera deberemos primeramente pulsar el botn Fetch list que abrir la lista de repositorios disponibles, nosotros elegiremos el ms cercano, que en este caso es Spain (Madrid). Una vez que nos hayamos conectado al repositorio que nos corresponde, en la ventana que mostrbamos anteriormente aparecer la lista de libreras disponibles tal y como se muestra en la siguiente imagen:

    Ilustracin 2.6.3 Instalacin de libreras. Eleccin de librera

    Para terminar la instalacin simplemente seleccionaremos la librera deseada y pulsaremos Install Selected.

    En ocasiones puede pasar que al realizar cierto anlisis sea necesaria alguna librera, en este caso se mostrar un mensaje de error y no se realizar el anlisis hasta que hayamos cargado la librera.

    Ilustracin 2.6.4 Mensaje de necesidad de carga de librera

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 28

    2.7. Funciones disponibles en RKWard

    Para finalizar la introduccin del programa y antes de entrar en detalle en cada una de las opciones que nos ofrece, procedemos a describir resumidamente las posibilidades tanto grficas como analticas que nos ofrece RKWard.

    Como ya dijimos al principio del captulo, RKWard es un software que est en continuo desarrollo gracias a la colaboracin de investigadores que van incorporando nuevas funcionalidades. En este trabajo nos limitaremos a explicar las ms relevantes y utilizadas, aunque RKWard ofrece la posibilidad de realizar contrastes y anlisis muy especficos.

    Todas las funciones disponibles estn accesibles a travs de tres opciones de la barra de mens situada en la parte superior de la pantalla, Analysis, Plot y Distributions. A continuacin pasamos a describir brevemente las funciones contenidas en cada uno de los controles del men.

    2.7.1. Analysis

    Este control incluye las funciones para realizar diferentes anlisis, desde los ms simples como un simple anlisis descriptivo hasta test ms complejos como contrastes de hiptesis paramtricos y no paramtricos.

    Ilustracin 2.7.1 Men de anlisis

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 29

    Las funciones disponibles en este men son:

    Basic Statistics /Descriptive Statistics: Estas dos funciones nos ofrecen la posibilidad de realizar diferentes estadsticos del anlisis descriptivo, como puede ser el clculo de la media, mediana, desviacin tpica,

    Correlation /Crosstab: Con estas dos opciones podemos estudiar la relacin entre variables, tanto variables cuantitativas como cualitativas, calculando la matriz de correlaciones y tablas de contingencia respectivamente.

    Item Response Theory: Incluye diferentes test y funciones para el anlisis de encuestas.

    Means / Moments / Variance/Scale / Wilcoxon tests: En estos apartados aparecen diferentes tests de contraste de hiptesis tanto paramtricos como no paramtricos.

    Outlier Tests: Permite realizar diferentes tests para localizar datos atpicos.

    Regression: Esta funcin permite realizar modelos de regresin, esta funcin en estos momentos est poco desarrollada y permite nicamente ejecutar la funcin lm.

    Time Series: Permite realizar diferentes tests para el anlisis de series temporales.

    2.7.2. Plots

    En este apartado se nos ofrecer la posibilidad de realizar multitud de grficos, desde los ms habituales como histogramas y diagrama de sectores entre otros, a grficos ms especficos como el grfico de Pareto o los grficos usados para el anlisis de encuestas.

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 30

    Ilustracin 2.7.2 Men de grficos

    El listado de grficos disponibles es el siguiente:

    Diagrama de barras (Barplot)

    Diagrama de cajas (Box Plot)

    Grfico de densidad (Density Plot)

    Grfico de puntos (Dotchart)

    Grfico de funcin de distribucin emprica acumulada (ECDF Plot)

    Grfico genrico (Generic Plot)

    Histograma (Histogram)

    Grfico de Pareto (Pareto chart)

    Diagrama de sectores (Piechart)

    Diagrama de dispersin (Scatterplot)

    Matriz de diagramas de dispersin (Scatterplot Matrix)

    Grfico de hojas y de tallos (Stem-and-Leaf Plot)

    Grfico de bandas (Stripchart)

    Item Response Theory

    Como ya veremos en el captulo que dedicaremos a los grficos, la principal ventaja que tiene RKWard a la hora de generar los grficos es que nos ofrece la posibilidad de visualizar los grficos mientras los estamos generando, de esta forma podremos dar el formato que deseemos e ir cambiando las diferentes opciones hasta conseguir el grfico deseado.

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 31

    2.7.3. Distributions

    Este apartado incluye los diferentes test de normalidad, adems para las diferentes distribuciones podremos calcular la funcin de distribucin, funcin de cuantiles, grficos de la funcin de distribucin y de densidad, y podremos comparar la suma de variables de la misma distribucin con la distribucin normal a partir de sus histogramas y su funcin de distribucin.

    Ilustracin 2.7.3 Men de distribuciones

    Los test de normalidad incluidos en RKWard son:

    Test de normalidad de Anderson- Darling.

    Test de normalidad de Cramer von Mises.

    Test de normalidad de Lilliefors (Kolmogorv-Smirnov).

    Test de normalidad de Pearson chi-square.

    Test de normalidad de Shapiro-Francia.

    Test de normalidad de Shapiro-Wilk.

    Test de normalidad de Jarque-Bera.

    Y las distribuciones disponibles son:

    Variables aleatorias continuas:

    o Beta

    o Cauchy

    o Chi- cuadrado.

    o Exponencial

    o F de Snedecor

    o Gamma

    o Gumbel

    o Logstica

    o Log-normal

  • 2. Introduccin a RKWard

    Curso virtual de RKWard | 32

    o Normal

    o t de Student

    o Tukey

    o Distribucin uniforme

    o Weibull

    Variables aleatorias discretas:

    o Binomial

    o Geomtrica

    o Hipergeomtrica

    o Binomial negativa

    o Poisson

    o Suma de rangos de Wilcoxon

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 33

    3. Carga de datos en RKWard

    Para comenzar a trabajar en RKWard es imprescindible tener cargados un conjunto de datos sobre los cuales trabajar. Aunque existen numerosas libreras de R que contienen bases de datos sobre las que trabajar, lo interesante es poder cargar conjuntos de datos que tengamos guardados quizs de alguna encuesta o estudio que hayamos realizado con anterioridad. RKWard, al igual que otros paquetes estadsticos, permite realizar la carga de datos que estn contenidos en ficheros Excel, ficheros de texto plano o ficheros generados por los programas estadsticos SPSS o STATA. Adems tambin existe la opcin de introducir los datos de manera manual o generar variables de datos aleatorios.

    3.1. Lectura de datos desde un fichero externo

    RKWard permite realizar la lectura de los datos que vamos a usar desde un fichero externo de una manera fcil y rpida. sta es la mejor opcin cuando los datos se han generado desde otro entorno de trabajo y a continuacin queremos, por ejemplo, realizar un anlisis exploratorio de los mismos.

    RKWard puede cargar ficheros de diferentes tipos, EXCEL en formato CSV, archivo de texto plano (.txt), archivos de SPSS o de STATA.

    Para ello tenemos dos caminos posibles o bien desde el men de la barra de herramientas eligiendo File->Import->Import format->Import Text / CSV data, o desde el botn situado debajo de la barra de herramientas Open-> Import->Import format y elegir una de las tres opciones disponibles dependiendo del tipo de archivo a cargar: Import SPSS, Import STATA Import Text / CSV data.

    Ilustracin 3.3.1.1 Opcin 1

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 34

    Ilustracin 3.3.1.2 Opcin 2

    3.2. Ficheros de datos de SPSS

    La carga de datos desde un archivo de SPSS es muy sencilla. Simplemente eligiendo File->Import->Import format->Import SPSS, llegaremos a la siguiente ventana:

    Ilustracin 3.2.1 Importar archivos de SPSS

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 35

    Primeramente, en el apartado File name cargaremos el archivo deseado de SPSS (extensin .sav). Para ello pulsando en el botn de la parte derecha de la caja roja que aparece debajo de File name, se abrir la ventana habitual del sistema operativo que nos permitir navegar entre las carpetas de nuestro ordenador para buscar el archivo deseado.

    Una vez cargado el archivo se nos indica que el conjunto de datos se va a cargar bajo el objeto padre .GlobalEnv, en caso de querer cargarlo bajo otro, slo tendremos que pulsar el botn Change y seleccionar el nuevo objeto bajo el cual se guardar el conjunto de datos. A continuacin nos da la opcin de nombrar nuestro conjunto de datos.

    Por defecto aparece marcado que el archivo ser importado como un data frame, es recomendable dejar esta opcin, en caso de desactivarla el archivo es importado como una lista y se hace ms difcil su manejo.

    Por ltimo aparecen algunas opciones relativas a las etiquetas del archivo, si se quieren pasar a formato de RKWard, si se quieren usar los valores de las etiquetas, el nmero mximo de etiquetas a importar y si se quieren eliminar los espacios en blanco de stas.

    En la pestaa de Encoding se muestran opciones sobre la codificacin de los campos, por lo que no entraremos en ms detalles.

    Para concluir basta pulsar el botn Submit.

    3.3. Fichero de texto plano o formato CSV

    A continuacin, veremos cmo cargar un archivo con formato CSV o de texto. Al elegir la opcin Import Text / CSV data nos aparecer la ventana mostrada a continuacin:

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 36

    Ilustracin 3.3.1 Importar fichero Texto/CSV

    Primeramente, en el apartado File name cargaremos el archivo deseado. Para ello pulsando en el botn de la parte derecha de la caja roja que aparece debajo de File name, se abrir la ventana habitual del sistema operativo que nos permitir navegar entre las carpetas de nuestro ordenador para buscar el archivo deseado.

    Una vez cargado el archivo se nos indica que el conjunto de datos se va a cargar bajo el objeto padre .GlobalEnv, en caso de querer cargarlo bajo otro, slo tendremos que pulsar el botn Change y seleccionar el nuevo objeto bajo el cual se guardar el conjunto de datos. A continuacin nos da la opcin de nombrar nuestro conjunto de datos.

    En el apartado Quick mode podemos especificar el tipo de archivo que estamos cargando, usando una de la cuatro opciones distintas a la primera (None) se marcarn en los apartados de la derecha las opciones correspondientes a cada uno de los distintos tipos de archivos, sin posibilidad de cambiar dichas opciones manualmente. En cambio, si dejamos la opcin por defecto, podremos sealar las opciones que mejor se adapten a nuestro fichero de datos.

    Si optamos por esta ltima opcin, primeramente debemos de indicar si el archivo cargado contiene los nombre de las variable en la primera fila, para lo que marcaremos la opcin Column

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 37

    names in first row, la forma en que son indicados los decimales y por ltimo mediante que carcter estn separados los campos en el fichero.

    En la siguiente pestaa de la ventana Rows and Columns podemos realizar diferentes ajustes relativos a las especificaciones de las filas y las columnas.

    Ilustracin 3.3.2 Importar archivo Texto/CSV 2

    En la parte izquierda de la pantalla podemos modificar el nombre de las columnas. Por defecto aparecer marcada la forma automtica, que nombrar las filas numricamente, tal y como hace la segunda opcin Numeric row names, la siguiente opcin, As specified in column x, activar la primera de las cajas que aparece en la parte inferior izquierda donde deberemos de introducir o bien el nombre de la columna donde se encuentran los nombres de las filas. En la ltima opcin, como en la anterior, tambin se pueden nombrar las filas, en este caso deberemos de introducir los nombres en un vector. Estas dos ltimas opciones son muy tiles cuando tenemos una variable identificador, al renombrar las filas con los valores de este campo podemos facilitar el acceso a filas concretas del conjunto de datos.

    En la parte derecha podemos elegir la forma de nombrar las columnas. Si elegimos la opcin por defecto (Default), en el caso de que la primera fila contenga los nombres de las variables estos sern los que aparecern, en caso de no indicar esto, los nombres por defecto usados por RKWard son V1, V2, V3, Al igual que ocurra en el caso de las filas se pueden nombrar las filas mediante un vector.

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 38

    En el ltimo apartado podemos indicar que tipo de datos contiene cada variable indicando stos mediante un vector o bien dejar la opcin por defecto que tratar de reconocer los tipos de datos. Cualquiera que sea la opcin que elijamos ms tarde podremos editar los datos y cambiar cmodamente el tipo de datos entre otras opciones.

    La ltima pestaa de la ventana de importacin contiene diferentes opciones para la configuracin de los datos.

    Ilustracin 3.3.3 Importar fichero Texto/CSV

    Las opciones disponibles son entre otras, que caracteres se admiten para delimitar las cadenas de caracteres, como se denotarn los valores faltantes, el nmero mximo de lneas que se quieren importar,

    Para concluir basta con pulsar el botn Submit.

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 39

    3.4. Carga manual de datos

    sta es una buena opcin cuando el grupo de datos que queremos cargar es pequeo, tanto en el nmero de variables que tiene el conjunto de datos como en el nmero de registros que tiene, de otro modo, lo ms cmodo ser cargarlos desde algn fichero que tengamos ya creado, tal y como se explic en el apartado anterior.

    Al abrir la interfaz de RKWard se nos da la opcin de iniciar el programa con una tabla vaca o con un editor de script vaco, tal y como se muestra en la imagen siguiente.

    Ilustracin 3.4.1 Pantalla de inicio

    O bien el cualquier momento, una vez iniciada la sesin, en la segunda lnea en la barra de men de herramientas en el botn Create eligiendo la opcin Dataset.

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 40

    En el primer caso, es conjunto de datos se crear con el nombre de my.data de manera predeterminada, que ms adelante se podr renombrar, si se elige la segunda opcin nos aparecer la siguiente pantalla donde podemos nombrar como deseemos el conjunto de datos:

    Ilustracin 3.4.3 Nombrar conjunto de datos

    Una vez nombrado el conjuto de datos aparecer la siguiente ventana, donde iremos introduciendo los nombres de las variables, asignaremos el tipo de dato correspondiente a cada variable, e iremos introduciendo los valores de cada una de las variables.

    Ilustracin 3.4.1 Creacin de conjunto de datos

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 41

    Ilustracin 3.4..2 Conjunto de datos vaco

    Por defecto aparecern 5 variables, cuyos nombres por defecto son, var, var1, var2, var3 y var4, pero como se aprecia en la ilustracin 2.4 se pueden incluir nuevas variables, para ello simplemente hay que introducir algn valor en alguno de los campos a rellenar en la parte superior, o bien introducir valores de la variable en la parte inferior, con lo cual inmediatamente se crear una nueva variable. Al igual que se pueden crear nuevas variables fcilmente, tambin se pueden eliminar si lo deseamos, para ello simplemente deberemos pulsar el botn derecho de nuestro ratn sobre la variable a eliminar y pulsar la siguiente opcin Delete this variable.

    Es recomendable definir el tipo de variables valores a tomar antes de introducir nuestros valores, ya que si lo hacemos de este modo, no se nos permitir introducir valores no vlidos. Las diferentes opciones disponibles para los formatos de variables las explicaremos en el siguiente apartado, ya que se puede aplicar tanto cuando se exportan los datos desde un fichero como cuando se introducen los datos de manera manual.

    Para concluir, se introducen los datos en las casillas de la parte inferior, segn vayamos introduciendo valores irn apareciendo nuevos registros.

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 42

    Ilustracin 3.4.3 Introduccin de datos

    Como se muestra en la ilustracin 2.5, si en una variable se introducen datos de un tipo diferente al de dicha variable, aparecern marcados en rojo para avisarnos de que no es un valor vlido.

    3.5. Definicin de variables de un conjunto de datos

    En el caso de que exportemos los datos desde un fichero de datos, ya sea Excel con formato CSV, texto plano o archivo de SPSS, RKWard tratar de reconocer los tipos de variables de forma automtica, en ocasiones stas no se identificarn de forma correcta y deberemos editar el conjunto de datos. Tambin deberemos realizar esto cuando los datos los hayamos introducido de manera manual tal y como explicbamos en el apartado anterior.

    Como veamos en las ilustraciones 2.4 y 2.5, los campos a editar son los siguientes:

    Name: es el nombre de la variable. Conviene que sea un nombre claro y conciso, ya que este ser el nombre con el que se referir el programa a la variable en el resto de ventanas del programa.

    Label: en este apartado se puede escribir una breve descripcin de la variable.

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 43

    Type: RKWard admite datos de tipo numrico, factor, cadena y lgicos.

    Ilustracin 3.5.1 Tipos de datos

    o El tipo numrico, Number, se refiere a las variables numricas, stas son las variables que nos encontraremos ms frecuentemente. Un ejemplo de este tipo de variables podra ser la variable Edad, que contiene las edades de los diferentes individuos de una base de datos.

    o Las variables de tipo Factor, son las tambin conocidas como variables categricas, tomaran una serie de valores que pueden ser numricos o de cadenas de caracteres que constituirn un conjunto de categoras. Por ejemplo, la variable Sexo, tomar los dos nicos valores H (Hombre), M (Mujer).

    o Las variables de tipo String, son pueden almacenar cadenas de caracteres, pero al contrario que en las varaibles categricas estos valores no forman categoras. Un ejemplo de este tipo de variables podran ser variables identificadores, por ejemplo los DNI de cada uno de los individuos de una base de datos. Habitualmente no usaremos estas variables para nuestros anlisis.

    o Por ltimo el tipo de variable Logical, se refiere a variables categricas dicotmicas, es decir es un tipo de variable categrica que nicamente toma dos valores posibles 0 (FALSE) y 1 (TRUE).

    Format: Permite definir el formato de los valores de las variables. Se puede elegir la alineacin de los valores entre izquierda o derecha, as como para las variables numricas podremos elegir el nmero de cifras decimales a mostrar.

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 44

    Ilustracin 3.5.2 Formato de variables

    Levels: Identifica las diferentes categoras de las variables de tipo categrico.

    Ilustracin 3.5.3. Categoras de la variable

    Como se muestra en la imagen anterior se han definido para una variable que define el grado de la enfermedad en cada uno de los pacientes, se han clasificado en cuatro fases distintas, Inicial, Intermedio, Avanzado y Terminal. A la hora de introducir

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 45

    los valores de la variable se podra hacer o bien escribiendo los literales anteriores o ms fcilmente introduciendo los valores numricos asociados a cada fase de la enfermedad, que son los nmeros que aparecen junto a cada estado.

    Cuando los datos se han cargado desde un archivo externo, RKWard detectar cuales son estas categoras de manera automtica, an as, estas categoras se pueden editar e introducir valores nuevos.

    Finalmente, despus de seguir estos pasos tendremos nuestro conjunto de datos listo para empezar a trabajar.

  • 3. Carga de datos en RKWard

    Curso virtual de RKWard | 46

  • Captulo 4.Grficos

    Curso virtual de RKWard | 47

    4. Grficos

    Las representaciones grficas son una herramienta muy til y usada habitualmente en la mayor parte de los anlisis estadsticos. Los grficos resultan muy tiles para mostrar la informacin de forma clara y llamar la atencin de los lectores, adems de, en algunos casos, ser tiles para encontrar datos atpicos, o ver tendencias en los datos.

    RKWard dispone de un amplio abanico de grficos para realizar mediante el men de grficos Plot.

    Ilustracin 4. Men de grficos

    Los grficos disponibles son:

    Diagrama de barras (Barplot)

    Diagrama de cajas (Box Plot)

    Grfico de densidad (Density Plot)

    Grfico de puntos (Dotchart)

    Grfico de funcin de distribucin emprica acumulada (ECDF Plot)

    Grfico genrico (Generic Plot)

    Histograma (Histogram)

    Grfico de Pareto (Pareto chart)

    Diagrama de sectores (Piechart)

    Diagrama de dispersin (Scatterplot)

    Matriz de diagramas de dispersin (Scatterplot Matrix)

    Grfico de hojas y de tallos (Stem-and-Leaf Plot)

    Grfico de bandas (Stripchart)

  • Captulo 4.Grficos

    Curso virtual de RKWard | 48

    Item Response Theory

    Una ventaja importante que ofrece RKWard frente a otros programas, es que nos permite la previsualizacin de los grficos mientras los estamos generando. A continuacin presentamos algunos los grficos utilizados ms habitualmente, indicando algunas de las principales opciones y ejemplos de cada uno de ellos:

    4.1. Diagrama de barras (Bar Plot)

    Los diagramas de barras son representaciones grficas en un eje cartesiano de las frecuencias de una variable cualitativa o discreta.

    Para realizar el diagrama de barras, accedemos mediante Plot->BarPlot lo que har aparecer la siguiente ventana.

    Ilustracin 4.1.1 Diagrama de barras. Variables

    Mediante las opciones de la primera pestaa podremos aadir etiquetas a las barras. Adems la opcin Preview que nos permitir ir viendo una vista preliminar del grfico que se va creando al ir eligiendo las distintas opciones.

  • Captulo 4.Grficos

    Curso virtual de RKWard | 49

    En la siguiente nos encontraremos una lista de opciones ms extensa, podremos hacer que aparezca la leyenda en el grfico y definir los colores de relleno de las barras entre otras opciones.

    Ilustracin 4.1.2 Diagrama de barras. Opciones

    Adems, podemos realizar ms cambios en el grfico pulsando el botn de la parte inferior de la ventana, Plot Options. Aparece una ventana con las siguientes pestaas:

    Ilustracin 4.1.3 Opciones de grficos. Ttulos

  • Captulo 4.Grficos

    Curso virtual de RKWard | 50

    Ilustracin 4.1.4. Opciones de grficos. Ejes

    En estas pestaas podremos aadir los ttulos y se muestran diferentes opciones los ejes del

    grfico (aadir nombres, modificar la escala de los ejes).

    Una vez hayamos seleccionado todas las opciones no tenemos ms que pulsar Close y volveremos a la ventana inicial donde pulsando Submit, se ejecutar y mostrar el grfico obtenido en la ventana de Output. Si necesitamos exportar el grfico a algn documento, la mejor opcin ser pulsar el botn derecho sobre la ventana de previsualizacin y pedir que se salve o bien copiar y pegarlo en el documento.

    Si hemos mandado el grfico a la ventana de output podremos recuperar el grfico en cualquier momento pulsando Run again.

  • Captulo 4.Grficos

    Curso virtual de RKWard | 51

    Ilustracin 4.1.5. Ejemplo grfico de barras. Fuente:INE

    4.2. Diagrama de cajas (BoxPlot)

    Con este tipo de grfico podremos obtener informacin sobre la distribucin de una o varias variables cuantitativas.

    Si seleccionamos la opcin Box Plot del men grficos, tendremos la siguiente pantalla (ilustracin 2.1) donde podemos seleccionar las variables que se van a representar en el grfico. RKWard permite representar ms de una variable simultneamente. Se dispone de varias opciones para etiquetar los grficos.

  • Captulo 4.Grficos

    Curso virtual de RKWard | 52

    Ilustracin 4.2.1. Diagrama de cajas. Variables.

    En la siguiente pestaa se da la opcin de representar los valores de la media, de la desviacin estndar, cambiar la orientacin del grfico, usar colores en el grfico

    Ilustracin 4.2.2. Diagrama de cajas. Opciones.

    Pulsando el botn Plot Options se nos abrir otra ventana que nos dar la posibilidad de realizar

    cambios en la apariencia del grfico, como es incluir ttulos en el grfico o nombrar los ejes del

    grfico entre otras opciones.

  • Captulo 4.Grficos

    Curso virtual de RKWard | 53

    Finalmente podremos obtener un grfico como el que mostramos a continuacin:

    Ilustracin 4.2.3. Ejemplo de diagrama de cajas.

    4.3. Histograma

    Utilizaremos este tipo de grficos para la representacin de variables continuas, como puede ser la edad de un grupo de individuos, su altura Este tipo de grfico nos dar una idea de la distribucin de la variable.

    Eligiendo la opcin Histogram del men de grficos, se abrir la ventana donde elegiremos la variable que queremos representar y podremos configurar las opciones relativas a los ttulos, ejes y cuadrcula pulsando el botn Generic Plot.

    En la siguiente pestaa se nos muestran diferentes opciones como son representar las frecuencias absolutas y relativas en el eje vertical y opciones para el trazado y color de las lneas y el relleno de las barras. Cabe destacar que podemos elegir entre varios mtodos para elegir el nmero de clases a representar.

    Peso Edad

    20

    40

    60

    80

    10

    01

    20

  • Captulo 4.Grficos

    Curso virtual de RKWard | 54

    Ilustracin 4.3.1. Histograma. Opciones.

    Si hemos elegido la opcin por defecto de representar las proporciones, se activar la siguiente pestaa, que da la opcin de dibujar la curva de densidad que mejor se ajusta al histograma. Adems se dan diferentes opciones, como son quitar valores nulos que pueden ser causantes de errores, elegir el nmero de puntos estimados para la curva, y el mtodo para la estimacin de la banda que contiene la curva.

    Ilustracin 4.3.2. Histograma. Curva de densidad.

  • Captulo 4.Grficos

    Curso virtual de RKWard | 55

    Una vez elegidos los parmetros podremos proceder a pintar el grfico.

    Ilustracin 4.3.3. Ejemplo de histograma.

    4.4. Diagrama de sectores (Piechart)

    Los diagramas de sectores permiten hacer una representacin circular de las frecuencias relativas de una variable cualitativa o discreta, lo que nos permitir comparar las categoras de una forma rpida y fcil.

    Para acceder a este tipo de grficos tendremos que elegir en el men Plot->Piechart.

    Ya que no hay ninguna caracterstica destacable para este tipo de grficos, mostramos directamente un ejemplo:

    Histograma de Peso de los enfermos

    Peso

    Pro

    po

    rci

    n

    40 60 80 100 120

    0.0

    00

    0.0

    05

    0.0

    10

    0.0

    15

    0.0

    20

    0.0

    25

    0.0

    30

    0.0

    35

  • Captulo 4.Grficos

    Curso virtual de RKWard | 56

    Ilustracin 4.4.1 Ejemplo de diagrama de sectores.

    4.5. Grfico de Pareto Usaremos el grfico de Pareto para identificar y dar un orden de prioridad de los datos. En el eje horizontal se representan las categoras de la variable que se quiere estudiar, representando una barra vertical proporcional a la frecuencia por cada una de las categoras, ordenando ests de manera descendente, y mostrando en el eje vertical derecho la escala de porcentajes. Adicionalmente, se representa mediante una lnea el porcentaje acumulado de dichas frecuencias. Accederemos al grfico mediante Plot->Pareto chart :

    Desempleado

    Estudiante

    Inactivo

    Ocupado

    Situacin Laboral

  • Captulo 4.Grficos

    Curso virtual de RKWard | 57

    Ilustracin 4.5.1.Grfico de Pareto. Variables

    Para realizar un grfico de Pareto la variable a representar puede estar construida de dos maneras diferentes:

    Si los valores que toma la variable corresponden a las frecuencias de cada una de las categoras. En el siguiente ejemplo se representan el importe de las exportaciones de Espaa a los diferentes pases de la Unin Europea. La variable est construida de la siguiente forma:

    Pas Cantidad exportada en

    miles de euros

    Austria 1358064.8

    Blgica 4396711.9

    Bulgaria 367158.4

    Repblica Checa 1277012.1

    Alemania 17699580.9

    Dinamarca 885329.3

    Estonia 65852.1

  • Captulo 4.Grficos

    Curso virtual de RKWard | 58

    El grfico resultante es el mostrado a continuacin. En l se puede observar que el 75% de las exportaciones se reparte entre nicamente cinco pases, Francia, Alemania, Portugal, Italia y Reino Unido.

    Ilustracin 4.5.2. Ejemplo de grfico de Pareto. Fuente: INE.

    Cuando tenemos las observaciones puras, es decir, tenemos un registro por individuo con el valor que toma para la variable a estudiar. Por ejemplo, en el siguiente archivo de datos tenemos las ausencias de los trabajadores de una empresa. La estructura de los datos sera la siguiente:

    Ausencia Motivo

    1 Gripe

    2 Gripe

    3 Gripe

    4 Indisposicin estomacal

    5 Gripe

    6 Visita mdico

    Fra

    ncia

    Ale

    ma

    nia

    Po

    rtu

    ga

    lIta

    lia

    Re

    ino

    Un

    ido

    Pa

    se

    s B

    ajo

    sB

    lg

    ica

    Po

    lon

    iaG

    recia

    Au

    str

    iaR

    ep

    b

    lica

    Ch

    eca

    Su

    ecia

    Din

    am

    arc

    aH

    un

    gr

    aR

    um

    an

    iaIr

    lan

    da

    Fin

    lan

    dia

    Eslo

    va

    qu

    iaE

    slo

    ve

    nia

    Bu

    lga

    ria

    Ch

    ipre

    Lu

    xe

    mb

    urg

    oM

    alta

    Litu

    an

    iaL

    eto

    nia

    Esto

    nia

    Exportaciones a la Unin Europea (miles de )

    Fre

    qu

    en

    cy

    0e

    +0

    02

    e+

    07

    4e

    +0

    76

    e+

    07

    8e

    +0

    71

    e+

    08

    0%

    25

    %5

    0%

    75

    %1

    00

    %

    Cu

    mu

    lative

    Pe

    rce

    nta

    ge

  • Captulo 4.Grficos

    Curso virtual de RKWard | 59

    Cuando nos encontramos ante este caso, para generar el grfico tendremos que pulsar el botn Tabulate que realizar internamente la tabla de frecuencias para luego representar el grfico.

    Ilustracin 4.5.3. Ejemplo de grfico de Pareto.

    4.6. Diagrama de dispersin

    Este tipo de grfico nos servir para conocer la relacin existente entre dos variables. Para ello se representar cada variable en un eje. Observando la nube de puntos podremos ver si existe algn tipo de relacin funcional entre las variables.

    En el siguiente grfico se representa el conjunto de datos cars de los conjuntos de datos implementados en R, donde se representa la velocidad de un grupo de coches y la distancia que han tardado en frenar. En el grfico se observa que a una mayor velocidad inicial la distancia de frenado es mayor.

    Gri

    pe

    Ind

    isp

    osic

    in

    esto

    ma

    ca

    l

    Vis

    ita

    m

    dic

    o

    Asu

    nto

    s F

    am

    ilia

    res

    Estr

    s

    Exa

    me

    n

    Fo

    rma

    ci

    n

    Au

    se

    ncia

    sin

    ju

    stifica

    r

    Tr

    mite

    s o

    ficia

    les

    Accid

    en

    te la

    bo

    ral

    Motivos de ausencias

    al puesto de trabajo

    Fre

    qu

    en

    cy

    05

    01

    00

    15

    0

    0%

    25

    %5

    0%

    75

    %1

    00

    %

    Cu

    mu

    lative

    Pe

    rce

    nta

    ge

  • Captulo 4.Grficos

    Curso virtual de RKWard | 60

    Ilustracin 4.6.1. Ejemplo de diagrama de dispersin.

    4.7. Matriz de diagramas de dispersin

    Esta opcin permite representar de forma simultnea los diagramas de dispersin para las distintas

    combinaciones posibles de ms de dos variables. Adems, tambin se podrn mostrar grficos

    univariantes relativos a las variables introducidas (grfico de densidad, diagrama de cajas,

    histograma o QQ-plot).

    Despus de elegir en la primera pestaa las variables que queremos representar, en la siguiente se

    nos da la opcin de elegir el tipo de grfico univariante que queremos representar o de no

    representar ninguno. Por otra parte, podemos pedir que no se dibujen los puntos del diagrama de

    dispersin (opcin por defecto), pintar las lneas de suavizado y las elipses de concentracin de

    datos.

    5 10 15 20 25

    02

    04

    06

    08

    01

    00

    12

    0

    Velocidad

    Dis

    tan

    cia

    de

    fre

    na

    do

  • Captulo 4.Grficos

    Curso virtual de RKWard | 61

    Ilustracin 4.7.1. Matriz de diagramas de dispersin.

    En el siguiente ejemplo tenemos una muestra de mujeres para las que tenemos su peso, altura y

    edad. En la diagonal se han representado los diagramas de cajas para cada una de las variables y

    por encima y por debajo de la diagonal se han representado los diagramas de dispersin para cada

    uno de los pares de las variables, con la recta de regresin que mejor se ajustan en cada caso.

    Ilustracin 3.7.2. Ejemplo de matriz de diagramas de dispersin. Fuente: Datos de R.

    Mujeres...Peso...

    30 32 34 36 38

    55

    60

    65

    70

    75

    30

    32

    34

    36

    38

    Mujeres...Edad...

    55 60 65 70 75 150 160 170 180

    150

    160

    170

    180

    Mujeres...Altura...

  • Captulo 4.Grficos

    Curso virtual de RKWard | 62

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 63

    5. Anlisis

    Siempre que nos encontramos ante un conjunto de datos lo primero que debemos hacer es realizar un anlisis descriptivo de los mismos. Con ello podremos observar las caractersticas de las distintas variables que forman el conjunto de datos, y adems podremos identificar tanto datos anmalos como datos faltantes.

    5.1. Estadsticos descriptivos

    Comenzaremos con el clculo de los estadsticos bsicos. Para ello RKWard dispone de dos opciones en el men:

    1) Analysis->Basic Statistics

    2) Analysis-> Descriptive Statistics

    Ilustracin 5.5.1.1 Anlisis descriptivo

    A continuacin describiremos la primera opcin por ser la ms completa de las dos.

    En este caso, los datos que vamos a analizar corresponden a una base de datos obtenida a partir de un grupo de pacientes de una consulta mdica. De ellos conocemos las siguientes variables:

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 64

    Sexo, Edad, Peso y Enfermedad que se trata de una variable dicotmica que contiene si el paciente tiene una determinada enfermedad o no.

    Para ello elegimos:

    Analysis->Basic Statistics

    Se mostrar la siguiente ventana:

    Ilustracin 5.5.1.2 Seleccin de variables

    Select variables

    En la primera pestaa tenemos que seleccionar las variables sobre las cuales queremos calcular los estadsticos. En este caso seleccionaremos las variables de tipo numrico, el programa no nos permite seleccionar las de tipo factor o de tipo cadena y para las de tipo lgico no tiene sentido calcular los estadsticos bsicos.

    En la siguiente pestaa de la ventana podemos elegir entre una serie de estadsticos:

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 65

    Ilustracin 5.5.1.3 Seleccin de estadsticos

    Statistics

    Los estadsticos bsicos que se pueden elegir son:

    General: eligiendo la opcin Length and NAs se nos muestra el nmero de registros y de registros nulos.

    Moments: en este apartado se pueden pedir los estadsticos de la media (Mean), varianza (Variance) y desviacin tpica (Sd).

    extrema: en este apartado podemos pedir que se muestren los valores extremos de las variables elegidas, se mostrar el mnimo y mximo eligiendo las opciones de Minimum y Maximum respectivamente. Adems en las casillas Number of minimum values displayed y Number of maximum displayed podemos pedir que se muestre el nmero de valores extremos que indiquemos.

    Quantile: para mostrar los estadsticos de posicin podemos seleccionar entre la mediana (Median), rango intercuartlico (Interquartile Range) y los cuartiles (Quartile). Adems de estos estadsticos de posicin podemos elegir otros, introduciendo para ello el nmero de particiones que queremos hacer.

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 66

    Robust statistics

    En la siguiente pestaa se muestran los estadsticos robustos:

    Ilustracin 5.5.1.4 Estadsticos robustos

    Entre ellos, quizs el que ms nos puede interesar es del apartado Robust mean que contiene la media truncada (Trimmed Mean), que al activarla se activa la casilla para hacer la eleccin del porcentaje de las colas que se quiere eliminar. Este estadstico nos ser muy til cuando nos encontremos ante un conjunto de datos con valores extremos, as podremos calcular la media sin que se vea afectado por estos valores extremos.

    Options

    La pestaa Options nos da la opcin de omitir los valores nulos as como de almacenar el anlisis

    descriptivo generado en un objeto de R.

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 67

    Ilustracin 5.5.1.5 Opciones

    Para finalizar el anlisis descriptivo bastar pulsar el botn Submit de la parte derecha y se generar el resultado.

    Salida de RKWard

    Una clara ventaja que ofrece RKWard respecto a R ejecutado desde su consola u otros interfaces como R Commander es la forma en la que devuelve los resultados. Estos aparecern en la pgina del Output con formato HTML, en lugar de aparecer en la consolada mezclndose entre el cdigo de R, lo que puede resultarnos mucho ms cmodo. En el caso que nos encontramos ahora el anlisis descriptivo, el resultado aparecer en una tabla con formato HTML, visualmente ms agradable que los resultados obtenidos con el interfaz habitual de R.

    La siguiente tabla que se muestra es la resultante del anlisis descriptivo realizado de las variables Edad y Peso de la base de datos descrita anteriormente.

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 68

    Ilustracin 5.5.1.6 Salida RKWard Anlisis descriptivo

    La salida muestra en primer lugar, en el texto que precede a la tabla, si se han omitido los valores nulos en el anlisis o no, as como que porcentaje de colas se han quitado para el clculo de la media truncada que en este caso es del 1%.

    En la tabla se muestra en la primera columna, la variable para la que se muestran los estadsticos. A continuacin se muestra el nmero de observaciones de cada variable y el nmero observaciones nulas que hay en cada variable. Los estadsticos mostrados a continuacin son la media (Mean), varianza (Variance) y desviacin estndar (Sd).

    En las siguientes columnas se muestran los valores extremos, el valor mnimo (Minimum) y el valor mximo (Maximum), adems le hemos pedido que se muestren los 5 valores inferiores (Minimum values) y los 5 valores superiores (Maximum values) de cada una de las variables.

    Las siguientes columnas mostradas son las correspondientes a los estadsticos de posicin, aparece la mediana (Median), el rango intercuartlico (Inter Quartile Range), los cuartiles (Quartile) y como le hemos pedido los deciles (Quantiles).

    En ltimo lugar aparece la media truncada (Trimmed Mean), con las colas cortadas al valor que le hemos indicado y que es mostrado en la leyenda anterior a la tabla.

    Si hemos elegido almacenar los resultados como un objeto de R, estos son almacenados en forma de data.frame. Esto puede ser muy til ya que podremos operar con estos valores como si se tratase de una variable ms.

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 69

    Ilustracin 5.5.1.7 data frame con resultados

    5.2. Correlacin

    Adems de analizar las variables de forma independiente, tambin debemos de realizar cierto anlisis si existe correlacin entre las variables.

    Para ello elegiremos tenemos dos opciones dentro del men de anlisis:

    Analysis-> Correlation ->Correlation Matrix

    Analysis-> Correlation ->Correlation Matrix Plot

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 70

    Ilustracin 5.5.2. Matriz de correlacin

    5.2.1. Matriz de correlaciones

    La primera de las opciones se nos muestra la matriz de correlaciones en su forma tradicional. Una vez hayamos hecho la seleccin de las variables en la primera pestaa de la ventana que se nos mostrar, en la siguiente pestaa podremos elegir el mtodo por el que calcularemos el coeficiente de correlacin, pudiendo elegir entre los coeficientes de correlacin de Pearson, de Kendall o de Spearman. Adems podremos pedir que se nos muestre el p-valor para los coeficientes de correlacin y que deseamos hacer con los datos faltantes.

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 71

    Ilustracin 5.5.2.1.1 Matriz de correlacin Opciones

    En el siguiente ejemplo tomaremos el conjunto de datos trees procedente de los conjuntos de

    datos implementados en R. En este conjunto de datos tenemos para una muestra de 31 cerezos

    negros para los cuales se ha tomado el valor para las variables grosor (Girth), altura (Height) y

    volumen (Volume). Queremos ver si existe correlacin entre las variables. La salida generada por

    el programa ser la siguiente:

    Ilustracin 5.5.2.1.2 Salida Anlisis de correlaciones

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 72

    En la imagen superior podemos observar la salida del anlisis de correlaciones de las variables de conjunto de datos trees. La salida muestra primeramente bajo que mtodo se ha calculado el coeficiente de correlacin, en este caso se eligi el coeficiente de correlacin de Pearson, adems tambin se mostrar la opcin elegida para el tratamiento de datos.

    La primera tabla que se muestra es la correspondiente a la matriz de correlaciones y en la tabla inferior se muestra el nmero de observaciones que han entrado en el clculo del coeficiente y p valor del coeficiente de correlacin de Pearson para cada par de variables.

    5.2.2. Grfico de Matriz de correlaciones

    Esta opcin nos muestra adems de la matriz de correlaciones, los diagramas de dispersin.

    A continuacin hacemos la representacin del conjunto de datos que hemos descrito anteriormente, trees.

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 73

    Correlation Matrix Plot

    Parameters Method: pearson

    Exclusion: pairwise.complete.obs

    Precision: 4 digits

    Scale text: TRUE

    Sun Nov 13 18:39:28 2011

    Legend: ***: p < 0.001 -- **: p < 0.01 -- *: p < 0.05 -- .: p < 0.1

    Ilustracin 5.0.2.1 Grfico de matriz de correlaciones

    En el grfico podemos observar en la parte inferior de la diagonal estn representados los grficos de dispersin para cada una de las combinaciones de variables, en la parte superior se muestran los coeficientes de correlacin y el nmero de estrellas indica la significacin del p-valor.

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 74

    5.3. Tablas de contingencia

    En ocasiones nos encontramos ante conjuntos de datos que contienen variables cualitativas y queremos analizar la relacin existente entre ellas, para ello utilizaremos las tablas de contingencia.

    Para realizar este anlisis accederemos mediante el men Analysis->Crosstabs y elegir entre las dos opciones N to 1 Crosstabulation y N to N Crosstabulation.

    La primera opcin, N to 1 Crosstabulation, permite realizar las tablas de contingencia para dos o ms variables, calculando las tablas de contingencia de la variable que se ha definido como dependiente con cada una de las variables definidas como independientes y se realizarn los correspondientes anlisis y grficos. Elegiremos la segunda opcin, N to N Crosstabulation, si queremos realizar tablas de contingencia combinando cada variable con todas las dems, aunque si deseamos un anlisis en ms profundidad elegiremos la primera opcin ya que sta no devuelve ms que las tablas de contingencia.

    Al seleccionar en el men Analysis->Crosstabs-> N to 1 Crosstabulation aparecer la siguiente ventana:

    Ilustracin 5.3.1 Tabla de contingencia

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 75

    En la primera pestaa seleccionaremos las variables, una como dependiente y el resto como

    independientes. Si adems deseamos realizar la prueba de independencia, marcaremos la opcin Chisquare, lo que activar la pestaa Chisquare Options, donde podremos elegir el mtodo por el cual estimar el p-valor, eligiendo entre el mtodo asinttico o el de Monte Carlo. Tambin se ofrece la posibilidad de realizar un diagrama de barras marcando la opcin Draw Barplot, est opcin a su vez activar la pestaa Barplot Options, donde podremos configurar el diagrama de barras como ya ocurra al realizar el diagrama de barras mediante el men Plot, que podremos previsualizar marcando Preview ( for barplot).

    A continuacin se muestra la salida resultante del anlisis de la independencia de las variables Sexo y Opinin del archivo Encuesta que contiene las opiniones recogidas mediante una encuesta sobre un determinado acontecimiento para un grupo de personas de las que se conoce el sexo, edad y clase social.

    Ilustracin 5.3.2 Salida test de independencia y tabla de contingencia

  • Captulo 5.Anlisis

    Curso virtual de RKWard | 76

    Como podemos observar, en primer lugar se nos muestra que variable hemos definido como variable dependiente y cual como variable de independiente, para a continuacin mostrar la tabla de contingencia.

    En cuanto al test de independencia, se muestra el mtodo utilizado para el estadstico, y en la tabla de la parte inferior se muestra el estadstico (Statistic), los grados de libertad (df) y el p-valor (p).

    Por ltimo el grfico que se ha generado es el siguiente:

    Ilustracin 5.3.3 Diagrama de barras

    Hombre Mujer

    Desfavorable

    Favorable

    Opinin

    01

    23

    45

    6

    5

    3

    4

    5

  • 6.Inferencia

    Curso virtual de RKWard | 77

    6. Inferencia

    Mediante la inferencia estadstica trataremos de generalizar los resultados obtenidos para una muestra a la poblacin completa con cierto grado de fiabilidad. RKward nos ofrece una extensa lista de contrastes, tanto paramtricos como no paramtricos, alguno de los cuales RCommander no los tiene disponibles.

    Entre los contrastes paramtricos tenemos los siguientes:

    t-Test para el contraste de medias.

    Para el contraste de homogeneidad de varianzas podemos utilizar el test de Bartlett o el test de Levene.

    F-test para la comparacin de varianzas.

    Los contrastes no paramtricos que nos ofrece RKWard son los siguientes:

    Test para dos muestras de Ansari-Bradley, utilizado para contrastar la igualdad de dispersin entre dos variables. Tambin est disponible la versin exacta del test que permite el clculo del p-valor en presencia de empates.

    Test de Fligner-Killen para la homogeneidad de varianzas entre muestras.

    Test de Mood para dos muestras para contrastar la diferencia de escala en los parmetros.

    Test de Wilcoxon que realiza tanto el contraste de la suma de rangos y el de los rangos de signos que es equivalente al test de Mann-Whitney.

    Para las pruebas de normalidad RKWard nos da a elegir entre siete test diferentes, a diferencia de R Commander que solo dispone del test de normalidad de Shapiro-Wilk. Los test disponibles son los siguientes:

    Test de normalidad de Anderson- Darling.

    Test de normalidad de Cramer von Mises.

    Test de normalidad de Lilliefors (Kolmogorv-Smirnov).

    Test de normalidad de Pearson chi-square.

    Test de normalidad de Shapiro-Francia.

    Test de normalidad de Shapiro-Wilk.

    Test de normalidad de Jarque-Bera.

    A continuacin mostramos alguno de los test ms utilizados:

  • 6.Inferencia

    Curso virtual de RKWard | 78

    6.1. Contrastes paramtricos

    6.1.1. t-Test para el contraste de medias

    RKward nos permite realizar la comparacin las medias para dos variables mediante este test, bajo distintas hiptesis. Para acceder a este test accederemos como se muestra en la siguiente imagen:

    Ilustracin 6.6.1.1.1 Men t-Test para medias

    Con lo que nos aparecer la siguiente ventana:

    Ilustracin 6.1.6.1.2 t-Test para dos variables

    En algunos anlisis y grficos se da la opcin de utilizar un asistente para guiarnos a travs de las diferentes opciones que se nos presentan. En esta ocasin utilizaremos dicho asistente, para ello

  • 6.Inferencia

    Curso virtual de RKWard | 79

    pulsaremos el botn Use Wizard, y la ventana anterior cambiar a la que se muestra a continuacin, que aade a la ventana anterior una pequea descripcin:

    Ilustracin 6.1.6.1.3 t-Test para dos variables. Asistente.

    En esta primera ventana debemos elegir las variables a comparar. A continuacin deberemos de definir la hiptesis alternativa (H1) del contraste:

    Bilateral (Two-sided):

    Unilateral:

    First is greater

    Second is greater

    Por ltimo deberemos indicar si las muestras son o no pareadas, marcando en el caso de que s lo sean la opcin Paired sample.

  • 6.Inferencia

    Curso virtual de RKWard | 80

    En la siguiente ventana se nos dan otras opciones ms avanzadas, como son asumir que las varianzas son iguales (esta opcin solo estar disponible cuando las muestras no son pareadas), o mostrar el intervalo de confianza, para el cual podremos elegir el nivel de confianza.

    Ilustracin 6.1.6.1.4 t-Test para dos variables. Opciones. Asistente.

    Por ltimo si estamos utilizando el asistente, antes de mostrar los resultados, aparecer una ltima ventana con el cdigo generado, en caso de no usar el asistente obtendremos este cdigo pulsando el botn Code.

  • 6.Inferencia

    Curso virtual de RKWard | 81

    Ilustracin 6.1.6.1.5 t-Test para dos variables. Cdigo.

    En el siguiente ejemplo tenemos dos grupos independientes de recipientes de distintos vidrios sobre los que se ha calculado la presin crtica para cada uno de ellos, obteniendo los siguientes resultados:

    Grupo 1 100 102 96 106 110 110 120 112 112 90 Grupo 2 104 88 100 98 102 92 96 100 96 96

    Queremos contrastar la igualdad de medias al nivel de confianza del 95%, suponiendo que las dos poblaciones son normales de varianzas iguales y desconocidas.

    Una vez hemos introducidos los datos y marcado las opciones correspondientes la salida ser la siguiente:

  • 6.Inferencia

    Curso virtual de RKWard | 82

    Ilustracin 6.1.6.1.6 Salida para el t-Test para dos variables.

    Como podemos observamos en la ilustracin 5.1.1.6, en primer se muestra las dos variables que se estn comparando y se define la hiptesis alternativa que en este caso es que las medias de las variables no sean iguales, o lo que es lo mismo la diferencia entre las dos medias no sea igual a 0. Adems se indica que se ha asumido la igualdad de varianzas.

    En la tabla que se muestra a continuacin podemos ver nuevamente cuales son las variables que se estn comparando y las medias estimadas para cada una de ellas.

    En las dos siguientes columnas aparecen los grados de libertad para el estadstico t que aparece a continuacin cuyo valor es 2.706 y seguido aparece el p-valor, nivel de confianza y el intervalo de confianza.

    A la vista de los resultados anteriores podemos decir que se rechaza la hiptesis nula de igualdad de medias.

    Una vez ms debemos destacar la facilidad que nos da RKWard a la hora de realizar los contrastes, tanto a la hora de obtener el resultado, ya que debemos conocer el nombre de la funcin a emplear y los parmetros que debemos introducir a la funcin, como a la hora de presentar los resultados de una forma clara. El cdigo que se muestra a continuacin sirve para realizar el mismo anlisis que hemos realizado anteriormente:

    t.test(Recipientes[["Grupo.1"]],Recipientes[["Grupo.2"]],alternative="two.sided", var.equal=TRUE)

    Y el resultado tendr la forma:

    Two Sample t-test

    data: Recipientes[["Grupo.1"]] and Recipientes[["Grupo.2"]]

    t = 2.7058, df = 18, p-value = 0.01447

    alternative hypothesis: true difference in means is not equal to 0

    95 percent confidence interval:

    1.922431 15.277569

    sample estimates:

    mean of x mean of y

    105.8 97.2

  • 6.Inferencia

    Curso virtual de RKWard | 83

    6.1.2. Test de Bartlett

    Mediante el test de Bartlett podremos contrastar la homogenidad de varianzas. Accederemos al test mediante Analysis-> Variances/Scale-> Parametric tests-> Bartlett test.

    Ilustracin 6.1.2.1. Test de Bartlett

    nicamente deberemos introducir las variables que contienen cada una de las muestras que queremos contrastar.

    En el ejemplo que se muestra a continuacin, se han utilizado 6 sprays insecticidas diferentes para tratar un total 72 unidades agrcolas experimentales. En la siguiente tabla se muestran los recuentos de insectos tratados, as como el insecticida utilizado en cada una de ellas:

    A 10 7 20 14 14 12 10 23 17 20 14 13

    B 11 17 21 11 16 14 17