30

pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

pi Estadisticas para arqueologos_final.indd 1 4/15/19 3:57 PM

Page 2: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

pi Estadisticas para arqueologos_final.indd 2 4/15/19 3:57 PM

Page 3: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

Estadística para arqueólogos

pi Estadisticas para arqueologos_final.indd 3 4/15/19 3:57 PM

Page 4: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

Para citar este libro: http://dx.doi.org/10.30778/2019.14

pi Estadisticas para arqueologos_final.indd 4 4/15/19 3:57 PM

Page 5: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

Estadística para arqueólogos

Un enfoque de sentido común

Robert D. Drennan y Víctor González Fernández

Universidad de los Andes Facultad de Ciencias Sociales

Departamento de Antropología

pi Estadisticas para arqueologos_final.indd 5 4/15/19 3:57 PM

Page 6: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

Primera edición: 1966, SpringerSegunda edición: 2009, SpringerPrimera edición en español: abril del 2019

© Universidad de los Andes, Facultad de Ciencias Sociales, Departamento de Antropología

© Robert D. Drennan y Víctor González Fernández

Ediciones UniandesCalle 19 n.° 3 -10, oficina 1401 Bogotá, D. C., ColombiaTeléfono: 339 4949, ext. 2133http://[email protected]

Facultad de Ciencias Sociales Carrera 1.ª n.° 18A-12, Bloque G-GB, piso 6Bogotá, D. C., ColombiaTeléfono: 339 4949, ext. 5567http://publicacionesfaciso.uniandes.edu.copublicacionesfaciso@uniandes.edu.co

ISBN: 978-958-774-800-0ISBN e-book: 978-958-774-801-7http://dx.doi.org/10.30778/2019.14Corrección de estilo: Manuel Antonio RomeroDiagramación interior: Precolombi, David ReyesDiseño de cubierta: Magda Lorena Morales

Impresión: Panamericana Formas e impresos S.A.Calle 65 n° 95-28Bogotá D.C. ColombiaTeléfono 4302110Bogotá, D. C., Colombia

Impreso en Colombia – Printed in Colombia

Universidad de los Andes | Vigilada Mineducación. Reconocimiento como universidad: Decreto 1297 del 30 de mayo de 1964. Reconocimiento de personería jurídica: Resolución 28 del 23 de febrero de 1949, Minjusticia. Acreditación institucional de alta calidad, 10 años: Resolución 582 del 9 de enero del 2015, Mineducación.

Todos los derechos reservados. Esta publicación no puede ser reproducida ni en su todo ni en sus partes, ni registrada en o transmitida por un sistema de recuperación de información, en ninguna forma ni por ningún medio, sea mecánico, fotoquímico, electrónico, magnético, electro-óptico, por fotocopia o cualquier otro, sin el permiso previo por escrito de la editorial.

Drennan, Robert D.

Estadística para arqueólogos: un enfoque de sentido común / Robert D. Drennan y Víctor González Fernández. – Bogotá: Universidad de los Andes, Facultad de Ciencias Sociales, Departamento de Antropología, Ediciones Uniandes, 2019.

XXXV, 440 páginas: ilustraciones; 17 x 24 cm.

ISBN 978-958-774-800-0

1. Arqueología – Métodos estadísticos I. González Fernández, Víctor II. Universidad de los Andes (Colombia). Facultad de Ciencias Sociales. Departamento de Antropología III. Tít.

CDD 930.102 SBUA

pi Estadisticas para arqueologos_final.indd 6 4/15/19 3:57 PM

Page 7: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

vii

Contenido

Lista de figuras · xiii

Lista de tablas · xix

Prefacio a la primera edición en español · xxv

Prefacio a la segunda edición en inglés · xxvii

Agradecimientos · xxxv

Parte I La exploración numérica · 1

Capítulo 1 Lotes de números · 3Gráficos de tallo y hojas · 4Gráficos de tallo y hojas espalda-con-espalda · 10Histogramas · 12Múltiples aglomeraciones o picos · 13Práctica · 15

Capítulo 2 El nivel o centro de un lote · 19La media · 19La mediana · 21Valores atípicos y la resistencia · 22Eliminación de valores atípicos · 23La media recortada · 24¿Cuál índice utilizar? · 26Lotes con dos centros · 26Práctica · 28

pi Estadisticas para arqueologos_final.indd 7 4/15/19 3:57 PM

Page 8: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

viii estadística para arqueólogos

Capítulo 3 La dispersión de un lote · 31El rango · 31La dispersión media o rango intercuartílico · 32La varianza y la desviación estándar · 33La desviación estándar recortada · 37¿Cuál índice utilizar? · 40Práctica · 40

Capítulo 4 Comparación de lotes · 43El gráfico de caja y puntos · 43Remoción del nivel · 49Remoción de la dispersión · 50Inusualidad · 53Estandarización basada en la media y la desviación estándar · 56Práctica · 57

Capítulo 5 La forma o distribución de un lote · 59Simetría · 59Transformaciones · 62Corrección de la asimetría · 65La distribución normal · 69Práctica · 71

Capítulo 6 Categorías · 73Proporciones de columna y de fila · 79Proporciones y densidades · 81Gráficos de barras · 83Categorías y sublotes · 86Práctica · 87

Parte II El muestreo · 89

Capítulo 7 Muestras y poblaciones · 91¿Qué es el muestreo? · 92

pi Estadisticas para arqueologos_final.indd 8 4/15/19 3:57 PM

Page 9: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

ixcontenido

¿Por qué muestrear? · 92¿Cómo muestreamos? · 94Representatividad · 98Diferentes tipos de muestreos y sesgos · 99El uso de muestras no aleatorias · 102La población objetivo · 109Práctica · 112

Capítulo 8 Muestras diferentes de la misma población · 115Todas las muestras posibles de un tamaño dado · 115Todas las muestras posibles de un tamaño dado más grande · 118El “lote especial” · 122El error estándar · 123

Capítulo 9 La confianza y la media de la población · 127Preparación para utilizar una muestra aleatoria · 127¿De qué poblaciones podría haber venido la muestra? · 130Confianza frente a precisión · 138Afinar probabilidades: prueba t de Student · 140Rangos de error para niveles de confianza específicos · 143Poblaciones finitas · 146Un ejemplo completo · 148¿Qué tan grande es la muestra que necesitamos? · 150Supuestos y métodos robustos · 152Práctica · 155

Capítulo 10 Las medianas y el remuestreo · 157El bootstrap · 160Práctica · 163

Capítulo 11 Categorías y proporciones de la población · 165¿Qué tan grande es la muestra que necesitamos? · 169Práctica · 171

pi Estadisticas para arqueologos_final.indd 9 4/15/19 3:57 PM

Page 10: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

x estadística para arqueólogos

Parte III Relaciones entre dos variables · 173

Capítulo 12 La comparación de las medias de dos muestras · 175La confianza, el significado y la fuerza · 180Comparación mediante la prueba t · 182La prueba t para una muestra · 187La hipótesis nula · 188Los resultados estadísticos y las interpretaciones · 192Supuestos y métodos robustos · 193Práctica · 195

Capítulo 13 La comparación de medias de más de dos muestras · 197La comparación mediante medias estimadas y rangos de error · 198La comparación mediante análisis de varianza · 201La fuerza de las diferencias · 207Diferencias entre poblaciones frente a relaciones entre variables · 210Supuestos y métodos robustos · 212Práctica · 214

Capítulo 14 La comparación de las proporciones de diferentes muestras · 215Comparación mediante proporciones estimadas y rangos de error · 215Comparación con chi-cuadrado · 217Las medidas de fuerza · 223El efecto del tamaño de la muestra · 224Diferencias entre poblaciones frente a relaciones entre variables · 226Supuestos y métodos robustos · 228Posdata: comparación de proporciones frente a una expectativa teórica · 229Práctica · 232

Capítulo 15 La relación entre una variable de medida y otra variable de medida · 235Observación de la situación general · 236Relaciones lineales · 238La línea recta de mejor ajuste · 240Predicción · 245

pi Estadisticas para arqueologos_final.indd 10 4/15/19 3:57 PM

Page 11: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xicontenido

¿Qué tan bueno es el mejor ajuste? · 246Significancia y confianza · 249Análisis de los residuales · 254Supuestos y métodos robustos · 258Práctica · 262

Capítulo 16 La relación entre rangos · 265El cálculo de la correlación de rangos de Spearman · 267Significancia · 269Supuestos y métodos robustos · 271Práctica · 272

Parte IV Temas especiales del muestreo · 273

Capítulo 17 El muestreo de una población con subgrupos · 275Agrupación de estimativos de medias · 276Agrupación de estimativos de proporciones · 279Los beneficios de un muestreo estratificado · 280

Capítulo 18 El muestreo de un sitio o región con unidades espaciales · 281Unidades espaciales de muestreo: puntos, transectos y cuadrículas · 282Estimativo de las proporciones de la población · 286Estimativo de medias en la población · 291Densidades · 293

Capítulo 19 Muestrear sin encontrar nada · 295

Capítulo 20 El muestreo y la realidad · 301

Parte V Análisis multivariado · 309

Capítulo 21 Métodos multivariados y variables · 311Un ejemplo de conjunto de datos · 313Tipos de variables, datos faltantes y paquetes estadísticos · 316

pi Estadisticas para arqueologos_final.indd 11 4/15/19 3:57 PM

Page 12: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xii estadística para arqueólogos

Capítulo 22 Similitudes entre casos · 321Distancia euclidiana · 323Distancia euclidiana con variables estandarizadas · 325Cuándo utilizar la distancia euclidiana · 327Variables de presencia/ausencia: coeficientes de cuadre simple y Jaccard · 328Conjuntos de datos de variables mixtas: coeficientes de Gower y Anderberg · 331Las similitudes entre las unidades domésticas de Ixcaquixtla · 333

Capítulo 23 Escalamiento multidimensional · 337Configuraciones en diferentes números de dimensiones · 338Interpretación de la configuración · 342

Capítulo 24 Análisis de componentes principales · 353Correlaciones y variables · 355La extracción de componentes · 357Realizar el análisis · 359

Capítulo 25 Análisis de agrupamiento · 365Agrupamiento por enlace simple · 366Agrupamiento por enlace completo · 368Agrupamiento por enlace promedio · 371Cuál criterio de enlace escoger · 373Cuántos agrupamientos definir · 374Agrupamiento por variables · 374Agrupamiento de los datos de las unidades domésticas de Ixcaquixtla · 376

Lecturas recomendadas · 379Libros de estadística general · 379Introducciones a la estadística para (y a menudo por) arqueólogos · 381Los arqueólogos consideran la estadística en nuestra disciplina · 382Análisis multivariado · 383

pi Estadisticas para arqueologos_final.indd 12 4/15/19 3:57 PM

Page 13: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xiii

Lista de figuras

Figura 1.1. Un gráfico de tallo y hojas de los números en la tabla 1.1 · 5

Figura 1.2. Un histograma del área de 29 sitios en el Valle del río Kiskiminetas · 13

Figura 4.1. Gráfico de tallo y hojas del diámetro (en cm) de las huellas de poste del sitio Smith · 45

Figura 4.2. Gráfico de caja y puntos que compara los diámetros (en cm) de las huellas de poste de los sitios Smith y Black · 47

Figura 4.3. Gráfico de caja y puntos de los diámetros de las huellas de poste (en cm) de los sitios Smith y Black con el nivel removido · 50

Figura 4.4. Gráficos de tallo y hojas, y de caja y puntos de los diámetros de las huellas de poste (en cm) de los sitios Smith y Black con el nivel y la dispersión removidos · 53

Figura 5.1. El efecto de las transformaciones sobre la forma del lote de medidas de la tabla 5.1 · 64

Figura 5.2. El uso de transformaciones para corregir la inclinación hacia arriba del lote en la tabla 5.2 · 67

Figura 5.3. Reglas de transformaciones: una regla “normal” (arriba); una regla que permite leer longitud con una transformación al cuadrado (centro); la misma transformación al cuadrado con marcas cada cinco unidades en lugar de una quinta parte de la longitud (abajo) · 69

Figura 6.1. Gráfico de barras de las proporciones de decoración incisa y no incisa en tiestos de los sitios Oak Grove, Maple Knoll y Cypress Swamp · 84

Figura 6.2. Gráfico de barras de las proporciones de ocho tipos cerámicos en los conjuntos de artefactos de los sitios Oak Grove, Maple Knoll, Cypress Swamp y Cedar Ridge · 84

pi Estadisticas para arqueologos_final.indd 13 4/15/19 3:57 PM

Page 14: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xiv estadística para arqueólogos

Figura 6.3. Gráficos de barras pseudotridimensionales que representan las mismas proporciones de la figura 6.2, pero de manera menos clara · 84

Figura 6.4. Gráficos de barras apiladas que representan las mismas proporciones de la figura 6.2, aunque de manera mucho menos clara · 85

Figura 6.5. Gráfico de barras en tres dimensiones, que hace imposible ver los patrones que eran visibles en la figura 6.2 · 86

Figura 6.6. Gráficos de torta que representan las mismas proporciones de la figura 6.2, pero en una manera muy deficiente · 86

Figura 9.1. El lote especial consistente en las medias de todas las muestras de 100 que se podrían seleccionar de una población con una media de 3,25 cm y una desviación estándar de 0,50 cm · 132

Figura 9.2. El lote especial para muestras de 100 de una población con una media de 3,25 cm y una desviación estándar de 0,50 cm · 133

Figura 9.3. El lote especial para muestras de 100 de una población con una media de 3,20 cm y una desviación estándar de 0,50 cm · 134

Figura 9.4. El lote especial para muestras de 100 de una población con una media de 3,30 cm y una desviación estándar de 0,50 cm · 134

Figura 9.5. El lote especial para muestras de 100 de una población con una media de 3,35 cm y una desviación estándar de 0,50 cm · 136

Figura 9.6. El lote conformado por las medias de todas las poblaciones de las que puede provenir una muestra de 100 con media de 3,35 cm y desviación estándar de 0,50 cm. La mayoría de las medias se encuentra dentro de un error estándar de la media de la muestra, pero un número considerable de medias son más grandes o más pequeñas que ésta · 136

Figura 9.7. El lote conformado por las medias de las poblaciones de las que puede provenir una muestra de 100 con media de 3,35 cm y desviación estándar de 0,50 cm. La gran mayoría de las medias se encuentra dentro de dos errores estándar de la media de la muestra · 137

pi Estadisticas para arqueologos_final.indd 14 4/15/19 3:57 PM

Page 15: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xvlista de figuras

Figura 9.8. El lote conformado por las medias de las poblaciones de las que puede provenir una muestra de 100 con media de 3,35 cm y desviación estándar de 0,50 cm. Sólo unas pocas medias se encuentran más allá de tres errores estándar desde la media de la muestra · 137

Figura 10.1. Gráficos de caja y puntos comparando las áreas de sitio de los periodos Clásico Temprano y Tardío · 159

Figura 10.2. Histograma de las medianas del área de sitio para las 10.000 remuestras de la muestra del periodo Clásico Temprano · 161

Figura 12.1. Comparación de las áreas (en m2) de los pisos de vivienda para los periodos Formativo y Clásico · 176

Figura 12.2. Un gráfico de caja y puntos con muescas comparando áreas de sitios del Clásico Temprano y Clásico Tardío · 194

Figura 13.1. Comparación de pesos de puntas de proyectil por periodo · 200

Figura 13.2. Gráficos de tallo y hojas de pesos de puntas de proyectil por subperiodo donde todos los subperiodos tienen medias similares · 202

Figura 13.3. Gráficos de tallo y hojas de pesos de puntas de proyectil por subperiodo, para los datos en la tabla 13.1 · 203

Figura 14.1. Comparación de las proporciones de tiestos de cuenco en los sitios San Pablo y San Pedro · 216

Figura 15.1. Gráfico de dispersión de número de azadas por cada 100 artefactos recolectados, por área del sitio · 237

Figura 15.2. Dibujo de algunas líneas rectas y sus ecuaciones correspondientes · 239

Figura 15.3. Más líneas rectas y sus ecuaciones correspondientes · 240

Figura 15.4. Si el gráfico de dispersión en la figura 15.1 fuera como éste, habría sido fácil ajustar una línea recta a los puntos · 241

Figura 15.5. Una línea recta que no se ajusta muy bien a los puntos de la figura 15.4 · 243

Figura 15.6. La línea recta de mejor ajuste para los puntos de la figura 15.1 · 244

Figura 15.7. La línea recta de mejor ajuste con su zona de confianza del 95 % · 250

pi Estadisticas para arqueologos_final.indd 15 4/15/19 3:57 PM

Page 16: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xvi estadística para arqueólogos

Figura 15.8. Gráfico de dispersión del número residual de azadas por productividad del suelo, con la línea recta de mejor ajuste y la zona de confianza del 95 % · 257

Figura 15.9. Los efectos devastadores de un único valor extremo sobre la línea recta de mejor ajuste · 259

Figura 15.10. El efecto de dos nubes de puntos ovaladas sobre la línea recta de mejor ajuste · 260

Figura 15.11. El efecto de las transformaciones de X sobre un patrón lineal curvado hacia abajo · 261

Figura 15.12. El efecto de las transformaciones de X sobre un patrón lineal curvado hacia arriba · 262

Figura 18.1. Una muestra aleatoria de cuadrículas seleccionadas individualmente · 283

Figura 18.2. Una muestra aleatoria de transectos (en realidad cuadrículas muy estrechas y largas) seleccionadas individualmente · 284

Figura 18.3. Una muestra aleatoria de transectos (en realidad cuadrículas muy estrechas y largas) determinada por la selección al azar de sus extremos · 284

Figura 18.4. Una muestra sistemática aleatoria de cuadrículas · 285

Figura 22.1. Medida de la distancia euclidiana entre puntas de proyectil en dos dimensiones · 322

Figura 23.1 Gráfico de la disminución de los valores de estrés final al aumentar el número de dimensiones, para el análisis de datos de las unidades domésticas de Ixcaquixtla · 339

Figura 23.2 Configuración de un escalamiento en dos dimensiones basado en las distancias entre ciudades · 341

Figura 23.3. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican una mayor proporción de cuencos) · 343

Figura 23.4. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican una mayor energía invertida en tumbas) · 344

pi Estadisticas para arqueologos_final.indd 16 4/15/19 3:57 PM

Page 17: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xviilista de figuras

Figura 23.5. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican una mayor proporción de cerámica decorada) · 344

Figura 23.6. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican una mayor proporción de restos de fauna) · 344

Figura 23.7. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican viviendas construidas sobre plataformas) · 346

Figura 23.8. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican presencia de cabezas de maza) · 346

Figura 23.9. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican mayores proporciones de concha marina) · 347

Figura 23.10. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican mayores proporciones de obsidiana) · 348

Figura 23.11. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican mayores proporciones de desechos de cocción) · 348

Figura 23.12. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla (círculos más grandes indican mayores proporciones de desechos líticos) · 349

Figura 23.13. Gráficos de dispersión del escalamiento en tres dimensiones de los datos de las unidades domésticas de Ixcaquixtla con indicaciones sobre los patrones y sus posibles interpretaciones (las unidades domésticas se indican con sus números) · 350

pi Estadisticas para arqueologos_final.indd 17 4/15/19 3:57 PM

Page 18: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xviii estadística para arqueólogos

Figura 25.1. Agrupamiento por enlace simple de los índices de similitud de la tabla 25.1 · 367

Figura 25.2. Agrupamiento por enlace completo de los índices de similitud de la tabla 25.1 · 369

Figura 25.3. Agrupamiento por enlace promedio de los índices de similitud de la tabla 25.1 · 371

Figura 25.4. Agrupamiento de las unidades domésticas de Ixcaquixtla · 375

Figura 25.5. Agrupamiento de las variables del conjunto de datos de Ixcaquixtla · 378

pi Estadisticas para arqueologos_final.indd 18 4/15/19 3:57 PM

Page 19: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xix

Lista de tablas

Tabla 1.1. Diámetros de 13 huellas de poste del sitio Black (cm) · 4

Tabla 1.2. Gráfico de tallo y hojas muy disperso del peso de 17 raspadores del sitio Black · 6

Tabla 1.3. Gráfico de tallo y hojas a una escala apropiada del peso de 17 raspadores del sitio Black · 7

Tabla 1.4. Gráfico de tallo y hojas muy denso del peso de 17 raspadores del sitio Black · 8

Tabla 1.5. Gráfico de tallo y hojas extremadamente denso de los pesos de 17 raspadores del sitio Black · 9

Tabla 1.6. Diámetros de 15 huellas de poste del sitio Smith (cm) · 10

Tabla 1.7. Gráfico de tallo y hojas espalda-con-espalda del diámetro de las huellas de poste de los sitios Black y Smith (tablas 1.1 y 1.6) · 11

Tabla 1.8. Áreas de 29 sitios en el valle del río Kiskiminetas · 12

Tabla 1.9. Raspadores del sitio Pine Ridge Cave · 16

Tabla 1.10. Raspadores del sitio Willow Flats · 16

Tabla 2.1. Pesos de lascas recuperadas de dos pozos campaniformes · 20

Tabla 2.2. Áreas de los pisos de estructuras en los sitios Black y Smith · 28

Tabla 3.1. Pesos de las lascas recuperadas de dos pozos campaniformes · 32

Tabla 3.2. Cálculo de la desviación estándar del peso de lascas del pozo 2 en la tabla 3.1 · 35

Tabla 3.3. Cálculo de la desviación estándar del peso de lascas del pozo 1 en la tabla 3.1 · 36

pi Estadisticas para arqueologos_final.indd 19 4/15/19 3:57 PM

Page 20: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xx estadística para arqueólogos

Tabla 3.4. Cálculo de la desviación estándar recortada al 5 % del peso de lascas obtenidas del pozo 1 en la tabla 3.1 · 39

Tabla 3.5. Áreas de los sitios de la Edad de Bronce cerca de Nanxiong · 41

Tabla 4.1. Remoción del nivel de los diámetros de huellas de poste del sitio Smith restando la mediana (17,2 cm) · 51

Tabla 4.2. Remoción de la dispersión de los diámetros de huellas de poste del sitio Smith dividiendo por la dispersión media (3,1 cm) después de haber removido el nivel (compare con la tabla 4.1) · 51

Tabla 4.3. Remoción del nivel y la dispersión de los diámetros de huellas de poste del sitio Black, restando la mediana (11,1 cm) y dividiendo por la dispersión media (2,1 cm) · 54

Tabla 5.1. Volúmenes de pozos de almacenamiento campaniformes del sitio Buena Vista · 60

Tabla 5.2. Volúmenes de pozos de almacenamiento campaniformes del sitio Buenos Aires · 61

Tabla 5.3. Transformaciones para corregir la asimetría · 66

Tabla 6.1. Información sobre 140 tiestos cerámicos · 74

Tabla 6.2. Tiestos de tres sitios · 78

Tabla 6.3. Decoración cerámica · 78

Tabla 6.4. Tiestos de decoración incisa y no incisa, de tres sitios · 80

Tabla 6.5. Proporciones y densidades · 81

Tabla 6.6. Áreas de los sitios en tres medioambientes del área de estudio en Al-Amadiyah · 88

Tabla 7.1. Números aleatorios · 96

Tabla 8.1. Medidas del diámetro para una pequeña población de huellas de postea · 116

Tabla 9.1. Distribución t de Student · 142

Tabla 9.2. Medidas del diámetro (cm) para una muestra de 25 fragmentos de borde de cuenco · 149

Tabla 9.3. Pesos de una pequeña muestra de puntas de proyectil · 154

Tabla 9.4. Longitudes (en cm) de 40 lascas utilizadas de Châteauneuf-sur-Loire · 155

pi Estadisticas para arqueologos_final.indd 20 4/15/19 3:57 PM

Page 21: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxilista de tablas

Tabla 9.5. Diámetros (en m) de 44 fogones del Mesolítico en Berwick-upon-Tweed · 156

Tabla 9.6. Contenido de cinc (en partes por millón) para 14 navajas de obsidiana de una residencia prehistórica en Huancabamba · 156

Tabla 10.1. Gráfico de tallo y hojas espalda-con-espalda de las áreas de sitio de los periodos Clásico Temprano y Tardío · 158

Tabla 12.1. Comparación de muestras de pisos de vivienda de los periodos Formativo y Clásico · 176

Tabla 12.2. Comparación de muestras de pisos de vivienda de los periodos Formativo y Clásico · 178

Tabla 12.3. Resumen de dos enfoques contrastantes a las pruebas de significancia en el contexto del ejemplo de pisos de vivienda · 190

Tabla 12.4. Contenido de circonio para una muestra de artefactos de obsidiana negra y gris del sitio Ollantaytambo · 196

Tabla 13.1. Datos de peso y periodo para una muestra de puntas de proyectil del periodo Arcaico del valle del río Cottonwood · 198

Tabla 13.2. Comparación de los pesos de puntas de proyectil de los subperiodos del periodo Arcaico · 199

Tabla 13.3. Ejemplo de resultado de computador para el análisis de varianza del ejemplo de este capítulo · 207

Tabla 13.4. Datos sobre las áreas de los pisos de vivienda de cinco sitios ocupados durante el Neolítico Temprano, Medio y Tardío cerca de Heiligenstadt · 213

Tabla 14.1. Tiestos de diferentes formas de vasija de los sitios San Pablo y San Pedro · 218

Tabla 14.2. Proporciones de fila de tiestos de diferentes formas de vasija de los sitios San Pablo y San Pedro · 218

Tabla 14.3. Número esperado de tiestos de diferentes formas de vasija de los sitios San Pablo y San Pedro · 218

Tabla 14.4. La distribución chi-cuadrado · 219

Tabla 14.5. Una muestra más grande de fragmentos de diferentes formas de vasijas de los sitios San Pablo y San Pedro · 225

pi Estadisticas para arqueologos_final.indd 21 4/15/19 3:57 PM

Page 22: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxii estadística para arqueólogos

Tabla 14.6. Números esperados de tiestos de diferentes formas de vasijas de los sitios San Pablo y San Pedro con una muestra de mayor tamaño · 225

Tabla 14.7 Reconocimiento regional en tres medioambientes · 230

Tabla 14.8 Una manera incorrecta de tabular los valores observados de la tabla 14.7 para una prueba de chi-cuadrado · 230

Tabla 14.9. Números observados y esperados de sitios para la prueba de chi-cuadrado · 232

Tabla 14.10. Desgrasante y acabado de superficie de los tiestos del sitio Opelousas · 233

Tabla 15.1 Observaciones sobre área y número de azadas en recolecciones de 100 artefactos, hechas en sitios de la fase Oasis en el valle del Río Seco · 236

Tabla 15.2. Azadas en sitios de la fase Oasis en el valle del Río Seco: predicciones y residuales · 253

Tabla 15.3. Número residual de azadas y productividad de los suelos para los sitios del valle del Río Seco · 255

Tabla 15.4. Datos de los pozos de almacenamiento de Yenangyaung · 263

Tabla 16.1. Productividad del suelo y aldeas en la llanura de Konsankoro · 266

Tabla 16.2. Valores de probabilidad para la correlación de rangos de Spearman rS para muestras de menos de 10 · 271

Tabla 16.3. Área del piso de vivienda e índice de estatus en artefactos para 12 viviendas excavadas en el sitio de Teixeira · 272

Tabla 17.1. Área del sitio (ha) en tres zonas ambientales · 276

Tabla 17.2. Gráfico de tallo y hojas de las áreas de los sitios de todas las tres muestras en la tabla 17.1 · 278

Tabla 18.1. Tiestos de una muestra aleatoria de diez unidades de excavación · 286

Tabla 18.2. Cálculo de la sumatoria ponderada de las desviaciones desde la proporción de la muestra general · 287

Tabla 18.3. Longitudes de las puntas de proyectil de una muestra de diez unidades de excavación · 291

pi Estadisticas para arqueologos_final.indd 22 4/15/19 3:57 PM

Page 23: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxiiilista de tablas

Tabla 18.4. Cálculo de la sumatoria ponderada de las desviaciones desde la media de toda la muestra · 292

Tabla 19.1. Niveles de confianza para concluir que la ausencia en una muestra indica una baja proporción en la población · 297

Tabla 21.1. Un conjunto de datos multivariado de las unidades domésticas de Ixcaquixtla · 314

Tabla 22.1. Medidas de cuatro puntas de proyectil · 322

Tabla 22.2. Distancia euclidiana entre las puntas de proyectil en la tabla 22.1 · 324

Tabla 22.3. Medidas estandarizadas de cuatro puntas de proyectil · 326

Tabla 22.4. Distancia euclidiana entre las puntas de proyectil en la tabla 22.1 con base en las variables estandarizadas en la tabla 22.3 · 327

Tabla 22.5. Los cuatro resultados posibles al comparar dos casos para una variable de presencia/ausencia · 329

Tabla 22.6. Algunas variables de presencia/ausencia codificadas para un conjunto de siete tiestos · 329

Tabla 22.7. Coeficiente de similitud de cuadre simple entre los tiestos de la tabla 22.6 · 331

Tabla 22.8. Coeficiente de similitud de Jaccard entre los tiestos de la tabla 22.6 · 331

Tabla 22.9. Coeficiente de similitud de Gower entre las 20 unidades domésticas de Ixcaquixtla, con base en los datos de la tabla 21.1 · 335

Tabla 23.1. Coordenadas en tres dimensiones del escalamiento multidimensional de las unidades domésticas de Ixcaquixtla · 340

Tabla 24.1. Autovalores de los componentes principales extraídos del conjunto de datos de Ixcaquixtla · 359

Tabla 24.2. Pesos de los componentes (sin rotar) para el análisis del conjunto de datos de Ixcaquixtla · 360

Tabla 24.3. Pesos de los componentes (con rotación ortogonal) para el análisis del conjunto de datos de Ixcaquixtla · 361

Tabla 25.1. Matriz de coeficientes de similitud de siete casos · 366

pi Estadisticas para arqueologos_final.indd 23 4/15/19 3:57 PM

Page 24: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxiv estadística para arqueólogos

Tabla 25.2. Matriz de coeficientes de similitud después del primer paso en agrupamiento por enlace promedio · 370

Tabla 25.3. Matriz de coeficientes de similitud después del segundo paso en agrupamiento por enlace promedio · 370

Tabla 25.4. Matriz de coeficientes de similitud después del tercer paso en agrupamiento por enlace promedio · 370

Tabla 25.5. Matriz de coeficientes de similitud después del cuarto paso en agrupamiento por enlace promedio · 371

Tabla 25.6. Matriz de coeficientes de similitud después del quinto paso en agrupamiento por enlace promedio · 371

pi Estadisticas para arqueologos_final.indd 24 4/15/19 3:57 PM

Page 25: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxv

Prefacio a la primera edición en español

Se ha dicho que uno de los aciertos de Statistics for Archaelogists está en el uso de un lenguaje preciso pero desprovisto de la jerga rebuscadamente técnica que afecta a muchos de los textos que tratan sobre herramientas de análisis de datos disponibles para el arqueólogo. En efecto, esa jerga rebuscada es en parte responsable de la desafortunada ausencia de las herramientas más útiles en muchos de los trabajos arqueológicos, y por eso el autor del libro buscó explí-citamente un acercamiento desde el sentido común a los principios básicos de la estadística y a su aplicación efectiva a la arqueología.

Durante varios años, colegas que trabajan en Latinoamérica han utilizado el libro, en inglés, como guía para el análisis de datos en arqueología, ya sea como referencia en la aplicación práctica en su investigación o como libro guía en cursos universitarios avanzados. Sin embargo, al usar el texto en inglés en el contexto universitario latinoamericano, en el que ese idioma es una segunda lengua, pero de uso aún bastante restringido, se puede desperdiciar la ventaja del libro de usar el lenguaje de uso diario, afín a su perspectiva de sentido común. Para el estudiante latinoamericano, el uso del libro en inglés requiere del esfuerzo adicional de familiarizarse con un vocabulario que es de uso común en países de habla inglesa, pero no es común en la literatura inglesa disponible para el estudiante latinoamericano.

Principalmente por esta razón vimos la necesidad de una versión del libro en español que sirviera precisamente para llevar a los arqueólogos hispanoha-blantes ese mensaje de las enormes ventajas que tiene la buena aplicación de la estadística a la arqueología mediante una aproximación directa a la com-prensión de sus principios básicos. La idea de una traducción profesional fue rápidamente descartada porque representaba el riesgo de perder el uso de un lenguaje sencillo y directo. Lo mejor era una versión en español escrita en el lenguaje que se utiliza en el contexto en el cual más probablemente se utilizará: el de la práctica arqueológica en Latinoamérica. Así, en lugar de simplemente hacer una traducción, los autores de la versión en español nos

pi Estadisticas para arqueologos_final.indd 25 4/15/19 3:57 PM

Page 26: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxvi estadística para arqueólogos

propusimos producir un texto que llevara al lector de la manera más directa posible la explicación de los fundamentos básicos estadísticos, buscando así lograr el efecto del original en inglés de su aplicación más adecuada y exitosa.

Esperamos que hayamos logrado ese cometido y que los arqueólogos his-panohablantes, tanto estudiantes como profesionales, encuentren en este libro las guías básicas hacia esas herramientas que tantos lectores de la versión en inglés han incorporado a su kit personal.

Una de las advertencias de este libro es que hay que tener cuidado al seleccionar paquetes estadísticos con programas de computación que per-mitan adelantar los análisis en la forma adecuada. Pensando en el público latinoamericano, y en el variado y desigual acceso a recursos tecnológicos en sus países, queremos señalar que un muy buen paquete estadístico no tiene necesariamente que ser muy costoso. Para los ejemplos del libro se ha usado systat® y es probable que muchas universidades y centros de investigación ya hayan invertido en éste u otros paquetes comerciales tan completos disponi-bles en el mercado (Minitab, Stata, Statistica, sas, spss, etc.). Algunos de estos paquetes comerciales cuentan con versiones económicas o gratuitas para el uso universitario (por ejemplo, Mystat es una versión gratuita de systat® que permitirá reproducir gran parte de los ejemplos del libro). Sin embargo, dado el creciente aumento de su popularidad, incluso sobre paquetes comerciales, es necesario mencionar aquí a R (www.r–project.org), que es un lenguaje de programación libre de código abierto enfocado específicamente al análisis estadístico. Ya se encuentran disponibles en Internet algunas guías que muestran el uso de R con los ejemplos de Statistics for Archaelogists, y dada su disponibilidad en español y su gran versatilidad, creemos que finalmente muchos de los usuarios podrán encontrar en R un ambiente adecuado para aplicar ampliamente las recomendaciones de este libro, especialmente en lo que se refiere al análisis exploratorio de datos.

Bogotá, D. C., Colombia

Robert D. Drennan y Víctor González Fernández

pi Estadisticas para arqueologos_final.indd 26 4/15/19 3:57 PM

Page 27: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxvii

Prefacio a la segunda edición en inglés

Este libro está diseñado como una introducción a los principios básicos y a las técnicas estadísticas para el arqueólogo. Surge principalmente de la expe-riencia del autor en la enseñanza de cursos de análisis cuantitativo para estu-diantes en arqueología de pregrado y de posgrado a lo largo de varios años. El libro se ubica específicamente en el contexto de la arqueología, no porque los temas tratados sean únicamente de carácter arqueológico, sino porque a muchas personas les resulta mucho más fácil entender el análisis cuantitativo en un contexto familiar, en el que fácilmente se pueda comprender la naturaleza de los datos y la utilidad de las técnicas. Los principios y las técnicas, sin embargo, son de aplicación mucho más amplia. Los antropólogos físicos, antropólogos culturales, sociólogos, psicólogos, politólogos y especialistas en otros campos aplican estos mismos principios y estas mismas técnicas. La particular combi-nación de temas, el énfasis relativo y el particular enfoque que aquí se describe, sin embargo, reflejan una visión personal de lo que es más útil en el análisis de datos específicamente arqueológicos.

Es imposible dejar de notar que muchos aspectos de la información arqueológica son numéricos y que el análisis arqueológico tiene un compo-nente inevitablemente cuantitativo. Con frecuencia, los enfoques estadísticos estándar se aplican a los problemas arqueológicos de forma directa, pero también en formas inusuales e ingeniosas, de manera que nuevos enfoques se han inventado para enfrentar las peculiaridades especiales del análisis arqueológico. La literatura sobre el análisis cuantitativo en arqueología ha crecido enormemente. Parte de esta literatura es muy buena, pero algo de ella sólo nos muestra que la publicación de estadística en arqueología es una actividad abierta incluso para aquellos cuya comprensión de los principios más fundamentales de la estadística es, en el mejor de los casos, precaria. El artículo que intenta señalar qué publicaciones se inscriben en cuál de estas dos categorías se ha vuelto en sí mismo un género reconocible. Este libro no trata de evaluar o criticar de esta forma, pero sí está motivado en parte por

pi Estadisticas para arqueologos_final.indd 27 4/15/19 3:57 PM

Page 28: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxviii estadística para arqueólogos

la percepción de que, como grupo, aquellos de nosotros responsables de la formación de arqueólogos en el análisis cuantitativo no podemos reportar más que un muy limitado éxito. En consecuencia, este libro es en parte una explicación de cómo se hace en arqueología el análisis de datos cuantitativos, pero en mayor medida es una discusión de cómo se podría hacer el análisis de datos cuantitativos en arqueología. Su enfoque decididamente está en algunos principios fundamentales y en cómo se pueden aplicar de manera más útil en la disciplina. Es tentador hablar de las numerosas variantes que existen de esas aplicaciones para el análisis de los datos arqueológicos y proporcionar ejemplos de las formas en que estos principios han sido puestos en práctica por los arqueólogos. Sin embargo, he tratado de resistir estas tentaciones en un esfuerzo por mantener la atención fija en los principios básicos y por pro-porcionar explicaciones breves y claras de ellos. Para mantener la simplicidad y la claridad, tanto los ejemplos utilizados en el texto como los problemas de práctica al final de cada capítulo son ideados y no seleccionados de datos arqueológicos reales. He asumido que los lectores de este libro sabrán lo suficiente sobre arqueología para no necesitar descripciones y fotografías de huellas de poste, pisos de vivienda, raspadores o tiestos, y que todos sabemos lo que significa decir que hemos adelantado un reconocimiento regional y medido las áreas de 53 sitios.

La mayoría de las técnicas en este libro son bastante estándar, ya sea en la estadística “clásica” desarrollada entre 1920 y 1950 o en la escuela más reciente de “análisis exploratorio de datos”. El enfoque o, quizá más importante, la actitud general de este libro se deriva en última instancia del trabajo de John W. Tukey y sus colegas y estudiantes, fundadores del análisis exploratorio de datos, o eda, por su sigla en inglés. Como es habitual en libros de carácter general sobre estadística, no se incluyen citas bibliográficas en el texto, pero sí una sección al final de lecturas recomendadas. Este libro se inclina a usar la terminología de eda, aunque los términos equivalentes más tradicionales también se mencionan. Cuando esto ayuda a que las explicaciones sean más fáciles de entender en el contexto de la arqueología, la terminología empleada es simplemente no estándar.

Los arqueólogos (y también otros) a veces están tan prevenidos de la esta-dística como unos colegiales ante el profesor más inflexible. La estadística parece un lugar lleno de reglas cuya lógica es oscura, pero cuya más leve infracción puede acarrear un reglazo en los nudillos. Esta actitud sin duda ha sido reforzada por críticas que reprenden trabajos publicados en arqueología por romper reglas sagradas de la estadística. Puede sorprender a muchos el saber que existe un número de versiones encontradas sobre muchas normas de la estadística. Los estadísticos, al igual que los practicantes de cualquier otra disciplina, a menudo no están de acuerdo sobre cuáles son los enfoques

pi Estadisticas para arqueologos_final.indd 28 4/15/19 3:57 PM

Page 29: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxixprefacio a la segunda edición en inglés

más productivos y las aplicaciones más legítimas. El uso de herramientas estadísticas a menudo implica hacer juicios subjetivos. En un esfuerzo por proporcionar una base sólida para tales juicios, los textos introductorios a menudo intentan reducirlos a normas estrictas, con lo que se crea una consi-derable confusión acerca de cuáles son realmente los principios fundamenta-les y cuáles son meras directrices para tomar difíciles decisiones subjetivas.

En síntesis, las normas de la estadística no estaban en las tablas de piedra que Moisés bajó de la montaña. Este libro abiertamente apoya tumbar las normas que se pueden encontrar en algunos textos (por medio de la razón y del sentido común, y no por la fuerza o la violencia). Dado que pretende ser una introducción a los principios estadísticos, no son apropiadas aquí largas discusiones contra los enfoques alternativos. Una cuestión, sin embargo, es de tan crucial importancia que sí debe ser mencionada. El enfoque adoptado aquí para las pruebas de significancia no involucra una rígida insistencia en rechazar o no una “hipótesis nula”. En arqueología es mucho más revelador, en la mayoría de los casos, limitarse a indicar qué tan probable es que la hipótesis nula sea correcta. La rigurosa formulación de la hipótesis nula, entonces, no recibe aquí la atención exhaustiva que a veces se le dedica en otros lados. En este acercamiento a la importancia de las pruebas de significancia y a varias cuestiones relacionadas con el muestreo, he seguido los pasos de George Cowgill (véanse las lecturas recomendadas al final del libro), aunque no he llevado a la práctica todas las sensatas sugerencias que él ha hecho. (Uno de los obstáculos para seguir algunas de sus sugerencias sigue siendo, como él señaló, que muy pocos de los programas estadísticos de computación dispo-nibles proporcionan la información necesaria en sus resultados). A quienes les fue enseñado que las pruebas de significancia fueron construidas sobre los cimientos del rechazar o no la hipótesis nula, les recomiendo una cuidadosa atención a las observaciones de Cowgill.

El enfoque adoptado aquí para pruebas de significancia hace especialmente importante el pensar con claridad acerca de las poblaciones, las muestras y los procedimientos de muestreo. De hecho, en muchos contextos, resulta que el simple uso de muestras para hacer declaraciones sobre las poblacio-nes de las cuales provienen sea un enfoque más atractivo que las pruebas de significancia. Por esta razón, las muestras y el muestreo son aquí objeto de un tratamiento mucho más extenso que el que es común en libros de intro-ducción a la estadística. La parte i de este libro trata sobre la exploración de lotes de números en formas que son interesantes y útiles en sí mismas, pero que se han escogido especialmente por su relevancia cuando esos lotes se consideran muestras de poblaciones más grandes. La parte ii desarrolla esta noción de los lotes como muestras y se enfrenta a algunos de los principios centrales que relacionan muestras con poblaciones. La parte iii presenta un

pi Estadisticas para arqueologos_final.indd 29 4/15/19 3:57 PM

Page 30: pi Estadisticas para arqueologos final.indd 1 4/15/19 3:57 PM

xxx estadística para arqueólogos

conjunto bastante estándar de pruebas básicas de fuerza y de significancia de las relaciones entre dos variables, junto con enfoques alternativos derivados directamente de la estimación muestral. La parte iv vuelve la mirada a una serie de diferentes cuestiones relacionadas con la toma de muestras y que son de especial importancia en la arqueología. Estos capítulos se relacionan más directamente con los de la parte ii, pero se han movido más adelante para no interrumpir la gradual acumulación de ideas que vinculan las partes ii y iii. Finalmente, la parte v plantea una rápida introducción a la exploración de patrones en conjuntos de datos multivariados. Nos lleva de regreso al ambiente de análisis exploratorio de datos que está más presente en la parte i.

En la arqueología, como en la mayoría de las disciplinas, los conceptos cuantitativos les llegan de manera fácil y natural a algunos y sólo con consi-derable esfuerzo a los demás. La ausencia de una inclinación natural hacia el razonamiento numérico se refuerza a menudo por la aceptación social de profesar la ignorancia de las matemáticas —una aceptación social alimentada por la idea de que las matemáticas son un tema arcano y especializado, sin ninguna utilidad para mucha gente—. Una persona, por lo demás muy bien educada, puede profesar una total incapacidad de comprender algo acerca de los números más allá de la suma y resta, sin incurrir en el desprecio que se esperaría si admitiera tener habilidades verbales tan limitadas como para comprender, de un periódico, solamente las tiras cómicas. El hecho de que existan varios grados de talento natural no debe ser más sorprendente para las matemáticas que para la lectura, el fútbol u otras actividades. Sin embargo, la visión de que las matemáticas son sólo un mal necesario de la escuela primaria agrava el problema al alentar a quienes encuentran difícil el razonamiento cuantitativo, a minimizar su importancia y a evitar el desa-rrollo de habilidades cuantitativas que les serían útiles. En consecuencia, un buen número de estudiantes parece embarcarse en estudios de posgrado en arqueología equipados sólo con el álgebra de secundaria —víctimas, tal vez, de la misma clase de malos consejos que yo mismo recibí como estudiante de primer semestre en la universidad, cuando mi consejero académico descali-ficó con sorna el curso de matemáticas en el que yo quería registrarme, como irrelevante para mis intereses—.

Este libro se ha escrito con la esperanza de proporcionar herramientas útiles para el análisis cuantitativo en arqueología a aquellos naturalmente hábiles en razonamiento cuantitativo, así como a aquellos que encuentran las matemáticas no sólo difíciles, sino incluso intimidantes. No es ningún desafío presentar la estadística a quienes ya tienen habilidades y se sienten cómodos con el pensamiento matemático, porque sólo se requiere un empujón en la dirección correcta. El gran desafío de libros como éste es poder presentar eficazmente el análisis cuantitativo a quienes no les parece algo natural. Con

pi Estadisticas para arqueologos_final.indd 30 4/15/19 3:57 PM