67
¿Cómo analizar un experimento en R? Un primer vistazo

¿Cómo analizar un experimentl en R? Un primer vistazoliceu.uab.es/~joaquim/phonetics/fon_met_exper/materiales_sandra... · consideramos palabras con poca frecuencia y palabras de

  • Upload
    hanga

  • View
    212

  • Download
    0

Embed Size (px)

Citation preview

¿Cómo analizar un experimento en R?

Un primer vistazo

Programa

● Experimento

● Método experimental

● Noción de variable

● Estadística descriptiva e inferencia estadística

● Análisis de un experimento en R

Método experimental

http://liceu.uab.es/~joaquim/phonetics/fon_met_exper/met_exp_fon.html#metodo_fonetica

Noción de variable

Noción de variable

● Escalas de medidas

● Variables dependientes, independientes y controladas

● Niveles en las variables

● Muestras inter- e intra-sujetos

Escalas de medidas

Escalas de medida

● Variables cuantitativas (numéricas)= Variables que pueden medirse, cuantificarse o

expresarse numéricamente

● Variables cualitativas (categóricas)= Variables que representan una cualidad o atributoque clasifica a cada caso en una de varias categorías

Escalas de medida

● Variables cualitativas (categóricas) (cont.)● Variables nominales●Variables en las que las categorías no mantienen

una relación de orden entre sí● Ej: sexo, color de los ojos, profesión, presencia/ausencia

de una característica, etc.

● Variables ordinales●Variables en las que existe cierto orden o jerarquía

entre las categorías● Ej: evaluación ("Excelente", "Bueno", "Malo", "Muy malo"),

posición en una carrera (1ero, 2do, etc.)

Escalas de medida: Ejercicio

Indique de qué tipo de variable se trata (numérica, nominal u ordenal):1. Posición en una carrera

2. Distancia en metros3. Temperatura

4. Peso en kilos5. Origen del locutor (Costa Rica/España)6. Respuesta "Sí/No" a una pregunta

Variables dependientes, independientes y controladas

Noción de variable

● Dependientes● "Lo que medimos"

● Ej. Porcentaje de identificación correcta, tiempo de reacción, duración silábica, tipo de errores de pronunciación, etc.

Noción de variable

● Independientes● Factores que afectan la variable dependiente

Ej. Lengua materna, competencia en L2, procedencia geográfica, contexto fonético, valores de los parámetros acústicos, etc.

Noción de variable

● Controladas●Neutralización de factores que pueden tener

influencia sobre la variable dependiente

● Ej. Lengua materna, procecendia geográfica, edad, sexo, nivel socio-educativo, etc.

Noción de variables: Ejercicio

En un experimento medimos el tiempo necesario para reconocer unas palabras concretas y unas palabras abstractas. Sólo consideramos palabras con poca frecuencia y palabras de más de tres sílabas. Indique:● La variable dependiente● La variable independiente

● Las variables controladas

Niveles en las variables

Niveles en las variables

● Variables categóricas

● =¿Cuántas categorías en la variable?● =¿Cuántos grupos en la variable?

Niveles en las variables

Ejemplo 1En un experimento de percepción del acento, losparticipantes oyen unas palabras de 3 sílabas y tienenque indicar lo más rápidamente posible la posición delacento. Las palabras son esdrújulas, llanas o agudas. Examinamos el tiempo de reacción (TR) para las respuestas correctas. ¿Existe una diferencia de TR entre los tres patrones acentuales?

Variable dependiente:Variable independiente:

Niveles en las variables

Ejemplo 2Hemos medido la velocidad de articulación en unoslocutores suizos, belgas y franceses. Tambiénexaminamos si existe una diferencia entre la velocidad de articulación de los hombres y de las mujeres. ¿Existe unadiferencia de velocidad de articulación entre las 3 regiones? ¿Existe una diferencia entre los hombres y las mujeres?

Variable dependiente:Variables independientes:

Muestras inter- e intra-sujetos

Muestras inter- e intra-sujetos

● "Between-groups"

● "Within-subject" ("repeated measures", medidas repetidas)

Muestras inter- e intra-sujetos

● Muestras inter-sujetos:● "Individuos" diferentes en los grupos

Ejemplos: ● Participantes sanos y pacientes afásicos● Participantes que oyen habla natural y otros que oyen "sasasa"

xx

x

x

x x

xx xxx

x

ooo

ooo

oo o oo

o

Grupo A

Grupo B

Los "individuos" del grupo A no son los mismos que los individuos delgrupo B.

Muestras inter- e intra-sujetos

● Muestras intra-sujetos:●Mismos "individuos" en los grupos

Ejemplos: ● Producción de palabras antes y después de un entrenamiento● Participantes que oyen habla natural y "sasasa"

Los "individuos" del grupo A son los mismos individuos que los delgrupo B.

xx

x

x

x x

xx xxx

xoo

ooo

o

oo o oo

o

S1

S3

S2

S4

Grupo A Grupo B

Muestras inter- e intra-sujetos: Ejercicio

¿Son muestras inter- o intra-sujetos en estosestudios?1. Se examina la percepción de la vocal

francesa /y/ antes y después de un entrenamiento.

2. Se compara la percepción de la vocal francesa /y/ en hispanohablantes y en italanohablantes.

3. Se compara la velocidad de elocución en dos tareas: lectura y habla espontánea.

Resumen

● El diseño de un experimento implicadeterminar:

● La variable dependiente y su escala de medida

● La(s) variable(s) independiente(s) y su escala de medida

Ejercicios

Experimento● Objetivo 1: determinar si la percepción de la

velocidad de elocución depende de la lenguamaterna

Variable dependiente:Variable independiente:

Ejercicios

Experimento● Objetivo 2: determinar si la percepción de la

velocidad de elocución está relacionada con la percepción de un acento regional

Variable dependiente:Variable independiente:

Tratamiento estadístico

● Estadística descriptiva●Representación gráfica●Medidas de tendencia central y de dispersión

● Inferencia estadística (prueba de hipótesis)

Estadística descriptiva

Estadística descriptiva

● Representación gráfica de la distribución de los datos

� ¿Cómo se distribuyen los datos?

●Diagramas de barras (variables categóricas)

●Histogramas (variables numéricas)● Boxplot (variables numéricas)

Estadística descriptiva

0

1

2

3

4

5

6

7

8

C2 C1 B2 B1 A2 A1

Nivel

Fre

cuen

cia

abso

luta

0

2

4

6

8

10

12

14

100 200 300 400 500 600 700 800 900 1000

Durée des pauses

Fré

quen

ce

Diagrama de barras Histograma

Boxplot

Estadística descriptiva

● Medidas de tendencia central

� ¿Alrededor de qué valor se agrupan losdatos?

●Media (variables numéricas)

●Mediana (variables numéricas e ordinales)●Modo (variables categóricas)

Estadística descriptiva

● Medidas de dispersión

� ¿Son los datos muy concentrados? ¿muydispersos?

●Rango (variables numéricas)●Desviación típica (variables numéricas)●Rango intercuartil (variables numéricas e

ordinales)● Indice de variación cualitativa(variables

categóricas)

0

2.5

5

7.5

10

12.5

15

17.5

20

22.5

Cou

nt

100 150 200 250 300 350 400 450 500 550 600 650Durée des pauses (ms)

Histogram0

2

4

6

8

10

12

Cou

nt

100 150 200 250 300 350 400 450 500 550 600 650Durée des pauses (ms)

Histogram

Mesures de tendance centrale et de dispersion

Media = 368 ms

Desviación típica = 102 ms

Rango = 426 ms

Media = 368 ms

Desviación típica = 53 ms

Rango = 216 ms

Inferencia estadística(prueba de hipótesis)

Prueba de hipótesis - Definición

● Objetivo

Determinar, con cierta probabilidad , si las diferencias observadas se deben a la casualidad o no.

Población y muestra

● Ejemplo: Los Españoles hablan másrapidamente que 300 sílabas por minuto?

● Medir la velocidad de TODOS los Españoleses casi imposible � subconjunto de Españoles

● Todos los Españole = población● Subconjunto de Españoles = muestra

Población y muestra

Muestreo

Población Muestra

Parámetros estimados

Dodge, 2006

Prueba de hipótesis - Definición

Ejemplo:Dos grupos de estudiantes hicieron una prueba de alemán. El primer grupo obtuvo un media de 15.75 y el segundo una media de 17.

� ¿Es el segundo grupo realmente mejor que el primer grupo o la diferencia entre los dos grupos se debe a la casualidad?

Prueba de hipótesis - Definición

10

11

12

13

14

15

16

17

18

19

20

Grupo A Grupo B

Grupo

Not

a

15.75

17.00

Prueba de hipótesis - Definición

x

x

x

x

xx

xx

xx

x

x

oo

o

oo

o

o

oo

o

o

o

Grupo A: Media = 15.75

Grupo B: Media = 17.00

Prueba de hipótesis - Definición

x

x

x

x

xx

xx

xx

x

x

oo

o

oo

o

o

oo

o

o

o

Grupo A: Media = 15.75

Grupo B: Media = 17.00

UNA POBLACION, DIFERENCIA DEBIDA A LA CASUALIDAD

La diferencia no es significativa

Prueba de hipótesis - Definición

x

x

x

x

xx

xx

xx

x

x

oo

o

oo

o

o

oo

o

o

o

Grupo A: Media = 15.75

Grupo B: Media = 17.00

DOS POBLACIONES DIFERENTES

La diferencia es significativa

Prueba de hipótesis - Definición

● Ejemplo: Test-t (compara las medias de dos grupos)

10

11

12

13

14

15

16

17

18

19

20

Grupo A Grupo B

Grupo

Not

a

15.75

17.00Diferencia significativa

El grupo B es mejor que el grupo A.

=> Dos poblaciones

Diferencia S

Prueba de hipótesis - Selección de la prueba

Prueba de hipótesis - Decisión

● El programa estadístico proporciona un valor pque permite decidir si la diferencia se debe a la casualidad o no.● Si p < .05 � diferencia significativa � la

diferencia no se debe a la casualidad● Si p > .05 � no diferencia significativa � la

diferencia se debe a la casualidad

-1.250 22 -2.112 .0463

Mean Diff. DF t-Value P-Value

A, B

Unpaired t-test for NoteGrouping Variable: GroupeHypothesized Difference = 0

Prueba de hipótesis - Ejemplo

¿Los francófonos avanzados en españolperciben más rápidamente o más lentamente el acento que los francófonos sin conocimientos del español?

Two Sample t-testt = -6.8456, df = 466, p-value = 2.411e-11Means Advanced NoKnowledge

1380.64 1686.70

Prueba de hipótesis - Ejemplo

Treinta participantes tuvieron que identificar unas secuencias (ej. great eyes, grey ties) producidas a una velocidad lenta y a una velocidad rápida. Los investigadores examinaron el efecto de la velocidad de elocución en la identificación de las secuencias mediante un análisis de varianza (F).

La media para la identificación de las secuencias rápidas era de 86.2% y era de 89.9% para las secuencias lentas. He aquí los resultados estadísticos en cuanto al efecto de velocidad de elocución: F(1, 29) = 21.86, p < 0.001.

Pregunta: ¿Cuál es la interpretación de los resultados?

Análisis de un experimento en R

Impacto de la L1 en la percepciónde la velocidad de elocución

Objetivo

● Determinar si la percepción de la velocidad de elocución depende de la lengua materna (francés o español)

Método

● Participantes● 28 oyentes de lengua materna española ("ES")

● 40 oyentes de lengua materna francesa ("FR")

● Material● 48 frases españolas

Método

Método

● Análisis de los datos● PercVelocidad = valor numérico entre 0 y 9

� Media por participante

● Variable dependiente?● Variable independiente?● Prueba?

R: Primer vistazo

Ej1.txt

Impacto del grado de acentoregional en la percepción de la velocidad de elocución en L1

Objetivo

● Determinar si existe una relación en losnativos entre la percepción de la velocidad de elocución y el grado de acento regional

Método

● Participantes● 40 oyentes de lengua materna española

● Material● Frases españolas producidas por locutores

españoles y costarricenses

Método

Método

● Análisis de los datos● PercVelocidad = valor numérico entre 0 y 9

� Media por frase● PercAcento = valor numérico entre 1 y 7

� Media por frase

● Variable dependiente?

● Variable independiente?● Prueba?

REj2.txt

Ejercicio

Estudio de la velocidad de articulación en los hombres y en

las mujeres

Objetivo

● Determinar si la velocidad de articulación es diferente en los hombres y en las mujeres

Método

● Participantes● 17 locutoras de lengua materna española

("Mujer")

● 17 locutores de lengua materna española("Hombre")

● Material● 20 frases españolas

Método

● Análisis de los datos●Medición de la duración silábica media para

cada frase y cada locutor● Duración silábica larga = velocidad de articulación lenta● Duración silábica corta = velocidad de articulación rápida

� Media por locutor

● Variable dependiente?● Variable independiente?● Prueba?

Ejercicio.txt

Unas referencias…

● Baayen, H. (2008). Analysing linguistic data. A practical introduction to statistics using R. Cambridge: Cambridge University Press.http://www.sfs.uni-tuebingen.de/~hbaayen/publications/baayenCUPstats.pdf

● Dalgaard, P. (2008). Introductory statistics with R (2nd ed.). New-York: Springer. http://www.academia.dk/BiologiskAntropologi/Epidemiologi/PDF/Introductory_Statistics_with_R__2nd_ed.pdf

● Dodge, Y. (2006). Premiers pas en statistique (2ème éd.). Paris: Springer.

● Grosjean, F. & Dommergues, J.-Y. (2011). La statistique en clair. Paris: Ellipses.

● Howell, D. (2013). Statistical Methods in Psychology (8th ed). Wadsworth: Cengage Learning

● Johnson, K. (2008). Quantitative methods in linguistics. Malden, MA: Blackwell Publishing.

● Witte, R.S. & Witte J.S. (2000). Statistics (6th ed.). Fort Worth [etc.] : Harcourt College Publ.