21
RESUMEN EJECUTIVO ANÁLISIS FORENSE ELECTORAL DE BOLIVIA PARA LAS ELECCIONES PRESIDENCIALES DE OCTUBRE DEL 2019 Grupo de Académicos de la Universidad Católica Boliviana “San Pablo” El objetivo de la democracia es el autogobierno de los ciudadanos de un país. Para lograr ese objetivo se hace necesario la existencia de instituciones electorales transparentes y confiables que puedan gestionar el voto de los ciudadanos hacia una elección justa de candidatos. Sin embargo, en algunos casos las instituciones a cargo de la gestión del voto alteran el mismo debido a intereses personales, políticos y/o económicos. Actualmente avances en técnicas científicas (análisis forense electoral) permiten identificar este tipo de actos de manipulación arbitraria de registros electorales. Estas técnicas se basan en el uso de leyes matemáticas universales que reflejan patrones de comportamiento de los números. Una de esas técnicas se basa en una ley matemática conocida como la Ley de Benford. Esta ley indica que los primeros dígitos de los números encontrados en cualquier tipo de registro no muestran una distribución uniforme. Más bien, se organizan de manera tal que el dígito "1" es el más frecuente, seguido del "2", "3", y de manera sucesivamente decreciente hasta "9". Quizás la mejor manera de convencerse a uno mismo de que la ley funciona es escoger un libro o revista al azar y enumerar u ordenar los números que se encuentren. Se notará que aproximadamente: (a) 33.4% de los números recopilados comenzarán con el número 1; (b) 18.5% comenzarán con el número 2; (c) 12.4% comenzarán con el número 3; (c) 7.5% comenzarán con el número 4; y así sucesivamente. Además, se ha demostrado que la Ley de Benford se puede aplicar a una amplia variedad de registros, que incluyen: facturas de electricidad, direcciones de las calles, precios de acciones, precios de viviendas, cantidad de población, tasas de mortalidad, tramos de ríos, procesos electorales y otros. En particular, un uso muy común de la Ley de Benford corresponde a la detección de manipulaciones arbitrarias de datos, donde se analizan registros existentes y se comparan con las proporciones mencionadas. En caso que las proporciones de los números recolectados no correspondan a las proporciones esperadas por la Ley de Benford, se considera como indicativo de la existencia de manipulación arbitraria de registros. A través del uso de la Ley de Benford se han identificado: fraudes fiscales en EEUU (Business Insider 2015), manipulación de cuentas del Gobierno Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington Post 2017) y otros. En consecuencia, la Ley de Benford ofrece una herramienta científica universal para la detección de actos de manipulación arbitraria de registros en diferentes tipos de procesos, como ser los procesos electorales. Por otro lado, para la detección de actos de manipulación arbitraria de registros también se cuenta con una ley estadística conocida como la Distribución Normal. En esencia, la Distribución Normal es una fórmula que se basa en dos parámetros simples (media y desviación estándar) que cuantifican las características de un conjunto dado de datos. Específicamente, la media indica el valor "central" o promedio de todo un conjunto de datos y la desviación estándar indica la "dispersión" o la variación de los puntos de datos alrededor de ese valor medio. La distribución se parece a una campana y por eso también se la llama la Campana de Gauss. Para no entrar en formulas complejas, se puede entender la Distribución Normal como una medición de cuán “normal” es un fenómeno bajo estudio. Específicamente, cuando el fenómeno bajo estudio no es “normal”, los datos obtenidos se comportan de forma extraña, excéntrica o anormal y no se parecen a una campana. En cambio, cuando el fenómeno bajo estudio es “normal”, la mayoría de los datos son más o menos parecidos (la mayor parte del tiempo) y se asemejan a una campana. En otras palabras, cuando los datos siguen una Distribución Normal, la mayor parte de los datos estarán alrededor del medio de la campana, mientras que unos pocos datos estarán en los alrededores. En

RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

RESUMEN EJECUTIVO

ANÁLISIS FORENSE ELECTORAL DE BOLIVIA PARA LAS ELECCIONES

PRESIDENCIALES DE OCTUBRE DEL 2019

Grupo de Académicos de la Universidad Católica Boliviana “San Pablo”

El objetivo de la democracia es el autogobierno de los ciudadanos de un país. Para lograr ese objetivo se

hace necesario la existencia de instituciones electorales transparentes y confiables que puedan gestionar el

voto de los ciudadanos hacia una elección justa de candidatos. Sin embargo, en algunos casos las

instituciones a cargo de la gestión del voto alteran el mismo debido a intereses personales, políticos y/o

económicos. Actualmente avances en técnicas científicas (análisis forense electoral) permiten identificar

este tipo de actos de manipulación arbitraria de registros electorales. Estas técnicas se basan en el uso de

leyes matemáticas universales que reflejan patrones de comportamiento de los números. Una de esas

técnicas se basa en una ley matemática conocida como la Ley de Benford. Esta ley indica que los

primeros dígitos de los números encontrados en cualquier tipo de registro no muestran una distribución

uniforme. Más bien, se organizan de manera tal que el dígito "1" es el más frecuente, seguido del "2", "3",

y de manera sucesivamente decreciente hasta "9". Quizás la mejor manera de convencerse a uno mismo

de que la ley funciona es escoger un libro o revista al azar y enumerar u ordenar los números que se

encuentren. Se notará que aproximadamente: (a) 33.4% de los números recopilados comenzarán con el

número 1; (b) 18.5% comenzarán con el número 2; (c) 12.4% comenzarán con el número 3; (c) 7.5%

comenzarán con el número 4; y así sucesivamente. Además, se ha demostrado que la Ley de Benford se

puede aplicar a una amplia variedad de registros, que incluyen: facturas de electricidad, direcciones de las

calles, precios de acciones, precios de viviendas, cantidad de población, tasas de mortalidad, tramos de

ríos, procesos electorales y otros. En particular, un uso muy común de la Ley de Benford corresponde a la

detección de manipulaciones arbitrarias de datos, donde se analizan registros existentes y se comparan

con las proporciones mencionadas. En caso que las proporciones de los números recolectados no

correspondan a las proporciones esperadas por la Ley de Benford, se considera como indicativo de la

existencia de manipulación arbitraria de registros. A través del uso de la Ley de Benford se han

identificado: fraudes fiscales en EEUU (Business Insider 2015), manipulación de cuentas del Gobierno

Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews

2019), irregularidades en las elecciones en Rusia (The Washington Post 2017) y otros. En consecuencia,

la Ley de Benford ofrece una herramienta científica universal para la detección de actos de manipulación

arbitraria de registros en diferentes tipos de procesos, como ser los procesos electorales.

Por otro lado, para la detección de actos de manipulación arbitraria de registros también se cuenta con una

ley estadística conocida como la Distribución Normal. En esencia, la Distribución Normal es una fórmula

que se basa en dos parámetros simples (media y desviación estándar) que cuantifican las características de

un conjunto dado de datos. Específicamente, la media indica el valor "central" o promedio de todo un

conjunto de datos y la desviación estándar indica la "dispersión" o la variación de los puntos de datos

alrededor de ese valor medio. La distribución se parece a una campana y por eso también se la llama la

Campana de Gauss. Para no entrar en formulas complejas, se puede entender la Distribución Normal

como una medición de cuán “normal” es un fenómeno bajo estudio. Específicamente, cuando el

fenómeno bajo estudio no es “normal”, los datos obtenidos se comportan de forma extraña, excéntrica o

anormal y no se parecen a una campana. En cambio, cuando el fenómeno bajo estudio es “normal”, la

mayoría de los datos son más o menos parecidos (la mayor parte del tiempo) y se asemejan a una

campana. En otras palabras, cuando los datos siguen una Distribución Normal, la mayor parte de los datos

estarán alrededor del medio de la campana, mientras que unos pocos datos estarán en los alrededores. En

Page 2: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

ese sentido, cuando los registros de un proceso complejo bajo análisis, como procesos electorales, no

siguen una Distribución Normal, se consideran como un indicativo de la existencia de algo inusual.

Basados en esos principios, la Distribución Normal se utiliza para: detección de procesos fraudulentos en

asignación de créditos (Giardino 2014), líneas de producción fuera de control (Muelaner 2019),

manipulación electoral (Klimek et al. 2012) y otros.

Para analizar la existencia de huellas de manipulación arbitraria en las bases de datos electorales de

Bolivia, nuestra investigación analizó la base de datos de elecciones presidenciales del 20 de octubre de

2019 realizadas en Bolivia. Específicamente, se utilizaron leyes estadístico-matemáticas que permiten la

detección de huellas de una posible manipulación arbitraria de registros en las bases de datos de votos

registradas en el sistema de Transmisión de Resultados Electorales Preliminares (TREP) y Conteo Oficial

del tribunal electoral de Bolivia (Órgano Electoral Plurinacional - OEP). Para ese propósito se descargó

de la página web del OEP las bases de datos del TREP al 95% (22:23 del 21 de octubre de 2019) y el

conteo oficial al 100% (20:31 del 24 de octubre del 2019). Luego de aplicar cuatro técnicas estadísticas

relacionadas con la Ley de Benford y cinco técnicas relacionadas con la Distribución Normal, se

detectaron huellas de manipulación arbitraria de registros. Específicamente, se encontró que la Ley de

Benford detecta manipulaciones numéricas en las bases de datos del TREP y conteo oficial para: (a) el

segundo dígito (2BL); (b) último digito para el partido CC (Ultimo C); y (d) último dígito para los

partidos CC y PDC (C05 y P05). Por otro lado, las cinco técnicas relacionadas con la Distribución

Normal detectaron anomalías en el TREP y Conteo Oficial relacionadas con: (a) síntomas mezclas de

votos de los votantes utilizando votos de fuentes arbitrarias para el partido CC (Unimodalidad); (b)

formas extrañas no simétricas y puntiagudas que no se aproximan a la Campana de Gauss (Skew, Kurt,

Test de Normalidad) (ver Fig. 1); y (c) mesas con porcentajes de votación superiores al 100% y patrones

de votación irregulares muy diferentes a un patrón ideal esperado (Huella Dactilar de Elecciones) (ver

Fig. 2).

En conclusión, el uso de leyes estadístico-matemáticas sugiere que las bases de datos de la elección

presidencial 2019 de Bolivia se han generado huellas relacionadas con manipulaciones arbitrarias de los

registros de votación. Además, nuestros resultados sirven como un marco referencial que explican los

posibles errores registrados durante esa contienda electoral (por ejemplo, ver Aré-Vasquez 2019; Molina

2019 y otros). En consecuencia, este estudio implementa un análisis forense electoral en Bolivia y abre

nuevos caminos de investigación forense de transparencia electoral.

Fig. 1 Distribución de datos de votantes TREP y Conteo Oficial

Nota. En ambas graficas se representan los histogramas de los datos de votación real para el TREP y el Conteo

Oficial. La línea continua representa el comportamiento ideal esperado de la variable analizada bajo condiciones

normales (Campana de Gauss).

Page 3: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Fig. 2 Huella dactilar de un Patrón Ideal vs TREP vs. Conteo Oficial:

Nota. En la gráfica de la izquierda se representa la huella dactilar de elecciones de una base de datos ideal.

En las gráficas del centro y de la derecha se representa la huella dactilar de elecciones para los datos del TREP y

del Conteo Oficial, respectivamente.

Referencias

Aré-Vasquez, T. (2019). Entrevista al informático que asegura que hubo fraude en las elecciones

de Bolivia: “Se computó el voto de ausentes para favorecer a Evo Morales". Retrieved November

2, 2019, from https://www.infobae.com/america/america-latina/2019/11/02/entrevista-con-el-

informatico-que-asegura-que-hubo-fraude-en-las-elecciones-bolivianas-se-computo-el-voto-de-

ausentes-para-favorecer-a-evo-morales/

Business Insider. (2015). This mathematical law can tell you whether a company is cooking its

books. Retrieved November 4, 2019, from https://www.businessinsider.com/deutsche-banks-use-

of-benford-law-to-detect-company-fraud-2015-6

Forbes. (2015). Greece financial crisis: Data science could have exposed warning signs.

Retrieved November 4, 2019, from https://www.forbes.com/sites/sap/2015/07/09/greece-

financial-crisis-data-science-could-have-exposed-warning-signs/#55d9864f6066

Giardino, J. (2014). Caught by the numbers: Data analytics winnows out possible fraudster.

Fraud Magazine. Retrieved from https://www.fraud-magazine.com/article.aspx?id=4294981970

Klimek, P., Yegorov, Y., Hanel, R., & Thurner, S. (2012). Statistical detection of systematic

election irregularities. Proceedings of the National Academy of Sciences of the United States of

America, 109(41), 16469–16473. https://doi.org/10.1073/pnas.1210722109

Matthews, R. (2019, January 11). Why a little-known law could be number one way to combat

global fraud. The National. Retrieved from https://www.thenational.ae/uae/science/why-a-little-

known-law-could-be-number-one-way-to-combat-global-fraud-1.811947

Molina, F. (2019). ¿En qué se basan las acusaciones de fraude que sacuden Bolivia? El País.

Retrieved November 2, 2019 from

https://elpais.com/internacional/2019/10/25/america/1572027831_226380.html

Muelaner, J. (2019). An introduction to statistical process control (SPC). Retrieved November 4,

2019, from https://www.engineering.com/AdvancedManufacturing/ArticleID/19494/An-

Introduction-to-Statistical-Process-Control-SPC.aspx

The Washington Post. (2017, January 11). When the Russians fake their election results, they

may be giving us the statistical finger. Analysis. Retrieved from

https://www.washingtonpost.com/news/monkey-cage/wp/2017/01/11/when-the-russians-fake-

their-election-results-they-may-be-giving-us-the-statistical-finger/

PATRON IDEAL TREP CONTEO OFICIAL

Page 4: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

INVESTIGACIÓN

ANÁLISIS ELECTORAL FORENSE DE BOLIVIA PARA LAS ELECCIONES

PRESIDENCIALES DE OCTUBRE DEL 2019

Grupo de Académicos de la Universidad Católica Boliviana “San Pablo”

RESUMEN

Las sociedades democráticas se construyen basadas en elecciones realizadas con libertad e imparcialidad.

Estadísticamente hablando, las elecciones pueden considerarse como experimentos sociales a gran escala

donde las personas se agrupan en mesas electorales y votan por el candidato de su preferencia. Debido a

que la elección presidencial conlleva un gran número de votantes, los datos obtenidos deberían cumplir

las leyes de la estadística-matemática (por ejemplo, la Ley de Benford). El no cumplimiento de las leyes

estadístico-matemáticas de las bases de datos electorales puede sugerir la existencia de irregularidades

como ser la manipulación arbitraria de registros electorales. Además, mediante una representación

adecuada de datos se pueden obtener las distribuciones estadísticas de los resultados electorales. Cuando

esas distribuciones muestran asimetrías excesivas, curtosis irregulares, huellas electorales dudosas y

comportamientos no normales, también pueden ser consideradas como huellas de manipulación arbitraria

de registros electorales.

Actualmente, la literatura boliviana e internacional adolece de estudios científicos relacionados con el

análisis forense al sistema electoral de Bolivia. Específicamente, la literatura boliviana e internacional

muestra la presencia de estudios políticos o sociológicos. Sin embargo, adolece de estudios cuantitativos

que analicen el fenómeno de las elecciones bolivianas desde una perspectiva cuantitativa. Para avanzar en

ese problema de la literatura, nuestro estudio analiza cuantitativamente los resultados de las últimas

elecciones presidenciales del 20 de octubre de 2019. En particular, se procesaron las bases de datos del

sistema de Transmisión de Resultados Electorales Preliminares (TREP) y del Conteo Oficial (CO) del

Órgano Plurinacional Electoral (OEP) de Bolivia. Como resultado, se obtuvo una muestra 33045 mesas

del TREP y 34552 mesas del Cómputo Oficial. A continuación, se procedió con la implementación de

pruebas relacionadas con leyes matemático-estadísticas a ambas bases de datos: (a) Ley de Benford (2BL,

UltimoC, C05 y P05): y (b) análisis de distribuciones de votantes (Unimodal, Skew, Kurt, Huella Dactilar

de Elecciones y Test de Normalidad).

Como resultado de los análisis se encontró que las diferentes técnicas producían resultados similares y

robustos para ambas bases de datos (TREP y CO). Específicamente, los resultados obtenidos sugieren la

existencia de huellas de manipulación arbitraria de los registros de votación. Finalmente, nuestra

investigación abre oportunidades de investigación para el desarrollo y validación de procesos electorales

en países subdesarrollados, como Bolivia.

Palabras clave. Análisis forense electoral, elecciones presidenciales, modelamiento estadístico, Bolivia

Page 5: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

1. INTRODUCCIÓN

Las sociedades democráticas son construidas alrededor del principio de libertad y elecciones justas

(Klimek et al. 2012). Las elecciones transparentes se caracterizan porque el conteo de votos es igualitario,

libre y justo. Sin embargo, en muchos casos los conteos de votos no son realizados de forma transparente

debido a intereses personales, políticos y/o económicos de las instituciones o personas encargadas de

gestionar los resultados electorales. Como resultado, se hace necesario distinguir si los resultados de una

votación se deben a la voluntad del pueblo, o la voluntad de las instituciones electorales.

El análisis forense electoral es un campo nuevo en el que los científicos utilizan un conjunto diverso

de herramientas estadísticas, incluidas técnicas similares a las desarrolladas para detectar fraude

financiero, para analizar datos electorales numéricos y detectar patrones artificiales que se desvían de los

patrones que deberían ocurrir naturalmente. Cuando las personas manipulan números dejan desviaciones

que naturalmente no ocurrían. Estas desviaciones sugieren que los números fueron intencionalmente

alterados o que otros factores han influenciado los resultados electorales. En consecuencia, Hicken y

Mebane (2017) sugieren que cuanto mayor sea el número de pruebas estadísticas que identifican patrones

que se desvían de lo que se espera que ocurra naturalmente, es más probable que la desviación resulte de

la manipulación de los votos, en lugar del voto libre y soberano.

A diferencia de otros países, a la fecha en Bolivia no se han realizado estudios cuantitativos que hayan

analizado de forma forense la información disponible de procesos electorales pasados. Al mejor de

nuestro conocimiento la mayoría de los estudios electorales científicos se enfocan a aspectos como:

participación indígena (Von Cott 2003), votación de emigrantes bolivianos (Lafleur y Sánchez-

Domínguez 2015), populismo (Lazar 2004), elecciones judiciales (Driscol y Nelson 2015) y otros. En

consecuencia, el presente estudio es el primero en la literatura boliviana e internacional en realizar un

análisis estadístico forense al sistema electoral boliviano. Los resultados de este estudio aportan a la

literatura boliviana e internacional como un marco referencial para el análisis estadístico forense de

elecciones previas y futuras en Bolivia. Por otro lado, los resultados de este estudio aportan a la literatura

metodológica electoral forense al brindar un panorama del estado de los procesos electorales de un país

subdesarrollado, como Bolivia.

En las siguientes secciones presentamos la revisión de literatura, donde se presentan aspectos

relevantes de la estadística electoral forense. Posteriormente, se presenta la metodología de análisis

estadístico forense basado en las investigaciones realizadas por Hicken y Mebane (2017) y Klimek et al.

2012. Luego se presentan los resultados y conclusiones del estudio.

2. REVISIÓN DE LITERATURA

Las elecciones pueden considerarse como experimentos sociales de gran escala. Es decir, un país se

segmenta en una gran cantidad de mesas electorales. Cada mesa electoral representa un experimento

estandarizado donde cada ciudadano materializa su preferencia electoral. En condiciones ideales, los

votos de los ciudadanos serán registrados sin modificaciones por los organismos electorales para poder

declarar un ganador del proceso electoral. Sin embargo, por razones personales, políticas y/o económicas

los organismos electorales realizan la alteración de los registros electorales. En ese sentido, existen

diferentes maneras de realizar manipulaciones arbitrarias de registros electorales. Por ejemplo, eliminar el

secreto del voto forzando a los ciudadanos a mostrar física o electrónicamente el partido por el que

votaron. Por otro lado, a pesar que la revisión de los registros electorales para la búsqueda de

incoherencias entre registros físicos y electrónicos puede establecer estadísticas descriptivas de una

posible manipulación arbitraria, bajo ninguna circunstancia pueden establecer la misma. Esto ocurre

porque, aunque las estadísticas descriptivas permiten entender la tendencia central y variabilidad de los

datos bajo análisis, estas no permiten hacer generalizaciones a la población. En ese sentido, la estadística

Page 6: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

inferencial ofrece herramientas matemáticas que permiten realizar generalizaciones a la población

indicando un rango de números potenciales junto con un grado de confianza (Taylor 2019). Bajo lo

anteriormente expuesto, el estudio de la manipulación arbitraria de procesos electorales hace necesario el

uso de técnicas de estadística inferencial.

Dentro de las técnicas de estadística inferencial para el análisis de manipulación de registros

electorales se encuentra una familia de técnicas científicas conocidas como análisis forense electoral. El

análisis forense electoral es un área científica emergente que busca aislar posibles anomalías electorales y

diagnosticar la precisión de los resultados electorales mediante técnicas estadísticas que pueden

identificar patrones y evaluar la probabilidad de que estas se deban a la casualidad (Hicken y Mebane

2017). Diferentes técnicas del análisis estadístico forense adoptan las técnicas desarrolladas para la

detección de fraudes financieros. El principio básico que comparten ambas áreas se relaciona con que

cuando las personas manipulan números dejan patrones de dígitos que probablemente no ocurrirían a

través de un proceso “natural”. En esencia, las manipulaciones numéricas dejan huellas claras. En

consecuencia, si los resultados electorales tienen patrones no naturales, esas anomalías pueden ser

detectadas utilizando técnicas estadísticas.

Los métodos del análisis forense electoral muestran tres ventajas claras. Primero, se basan en

resultados electorales objetivos reportados por los tribunales electorales de un país y no en observaciones

subjetivas de observadores electorales. Estos resultados se los utiliza exactamente como han sido

reportados sin ningún tipo de manipulación adicional o criterio subjetivo personal. Segundo, el análisis

forense electoral permite el análisis sistemático de todos los votos reportados de un país, incluso de

aquellos lugares que los observadores no tuvieron acceso por razones políticas, de seguridad o logística.

Tercero, el análisis forense electoral produce estimaciones confiables de la manipulación arbitraria, que

incluyen rangos de confianza de las conclusiones. Además, se diferencian de los métodos de observación

descriptiva que se basan en una vaga certeza del analista y que no necesariamente puede estar bien

fundamentada.

Dentro de los métodos de análisis forense electoral sobresalen aquellos relacionados con la Ley de

Benford (Benford 1938). Específicamente, algunas prácticas de manipulación numérica del voto dejan

huellas que se pueden detectar mediante métodos cuantitativos. En ese sentido, la Ley de Benford surge

como una herramienta de detección de manipulación arbitraria de registros electorales (Klimek et al.

2012). La Ley de Benford es una observación estadístico-matemática para muchos procesos de la vida

cotidiana y sugiere que el logaritmo del primer digito es una variable aleatoria y se encuentra

uniformemente distribuido. Como consecuencia, las desviaciones numéricas de esta ley indican la

existencia de otros mecanismos, posiblemente arbitrarios, que afectan los resultados. Por ejemplo, los

resultados de mesas de votación alejadas para cierto distrito electoral podrían haber sido manipuladas y

elegidas a conveniencia por el representante de un partido político que le gustan los múltiplos de 10. En

consecuencia, en comparación con votaciones no manipuladas, el digito 0 ocurrirá más frecuentemente

como el último dígito en los conteos manipulados de votos. De esa manera se rompe la Ley de Benford y

se infiere una posible manipulación arbitraria.

Otra manera de detectar posibles manipulaciones arbitrarias de registros electorales corresponde a la

revisión de la distribución de votantes y el número de votantes inscritos. Este análisis consiste en la

detección de dos mecanismos: rellenado forzado de votos y reporte de números inventados. Según

Klimek et al. (2012), estos tipos de análisis permiten identificar características diferenciadas del voto y

distribuciones de votantes manipuladas arbitrariamente. Específicamente, el rellenado forzado de votos no

solamente cambia la forma de la distribución de votos y participación, sino también muestra la existencia

de conteos de votos inusualmente altos que ocurren de forma paralela con niveles de votación

inusualmente elevados.

Page 7: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Bajo lo anteriormente expuesto, en esta investigación utilizamos la Ley de Benford para detectar la

existencia de mecanismos de manipulación arbitraria de registros electorales. Por otro lado, analizamos

las desviaciones de las distribuciones de votantes y su participación como evidencia de rellenado de votos

y números inventados. En consecuencia, de encontrarse evidencia de la existencia de ese tipo de procesos

se podrá inferir que la base de datos presenta evidencia de manipulación arbitraria de registros electorales.

3. METODOLOGÍA

3.1. Ley de Benford

Para la implementación de la Ley de Benford existen diferentes técnicas. En nuestro caso utilizaremos

las técnicas recomendadas por Hicken y Mebane (2017) que sugieren el uso de: (a) 2BL: (b) UltimoC: (c)

C05; y (d) P05. Específicamente:

(a) 2BL o conocida como media del segundo digito. Es una prueba estadística en la que se aplica la

prueba al segundo dígito significativo en cada conteo de votos. Por ejemplo, si el conteo es 4213,

entonces 2 es el segundo digito significativo. Perichi y Torres (2011) sugieren que cuando el

conteo de votos de una elección no es arbitrario, la distribución de los segundos dígitos es similar

a la Ley de Benford (ver Tabla 1). Esto sugiere que, si los segundos dígitos aparecen con las

frecuencias que muestra la Tabla 1, la media será de aproximadamente 4.187. En consecuencia,

cuando una elección muestra indicios de manipulación arbitraria, el conteo de dígitos del voto no

mostrará la distribución de la Tabla 1 y la media será diferente a 4.187.

Tabla 1: Distribución de la Ley de Benford

Dígito 0 1 2 3 4 5 6 7 8 9

Probabilidad 0.120 0.114 0.109 0.104 0.100 0.097 0.093 0.090 0.088 0.085

(b) UltimoC o conocida como media del último dígito. Es una prueba estadística relacionada a la

aplicación de la técnica al último dígito de cada conteo de votos. Por ejemplo, si el conteo es

4213, entonces 3 es último dígito. Beber y Scacco (2012) indican que, si se ha realizado una

elección sin manipulación arbitraria de registros, la distribución de los últimos dígitos debería ser

uniforme. Es decir, cada uno de los diez dígitos (0, 1, 2, 3, 4, 5, 6, 7, 8, 9) deberían ocurrir con la

frecuencia 1/10 (0,1). En consecuencia, cuando los últimos dígitos ocurren en esas frecuencias, su

media será 4.5. En consecuencia, en elecciones sin manipulación arbitraria de registros se esperan

valores aproximados de 4.5 para la media de valores calculados de UltimoC.

(c) C05 es la media de una variable binaria construida por valores 1 cuando el último digito del

conteo de votos para un partido bajo análisis es 0 o 5. El C05 es un caso especial del argumento

de Beber y Scacco (2012) donde se indica que cuando una elección no presenta evidencia de

manipulación arbitraria, la media de C05 debería ser similar a 0.2.

(d) P05 es la media de una variable binaria construida por valores 1 cuando el último dígito de un

porcentaje redondeado de votos para un partido o candidato bajo análisis es 0 o 5. Los individuos

dejan huella que cometieron actos de manipulación arbitraria cuando estos dígitos suben su

probabilidad de aparecer. Luego, cuando de la media de la variable indicada es diferente a 0.2 es

un indicio de manipulación electoral arbitraria.

3.2. Análisis de distribuciones de votantes

Para realizar en análisis de las distribuciones de los votantes se utilizarán las siguientes técnicas

sugeridas por Hicken y Mebane (2019) y Klimek et al. (2012): (a) DipT; (b) Skew; (c) Kurt; (d) huella

dactilar de elecciones; y (e) test de normalidad. Donde:

(a) Unimodalidad. Esta prueba sugiere que cuando una distribución de votantes es multimodal, es

indicativo de irregularidades. Específicamente, las distribuciones de votantes inscritos y de

Page 8: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

partidos participantes en la votación debería ser unimodal (Borghesi y Bouchaud 2010).

(b) Skew o asimetría. Esta prueba argumenta que cuando no existe comportamiento arbitrario, la

distribución de la votación debería ser aproximadamente normal. En consecuencia, las

mediciones de asimetría significativamente diferentes de cero sugieren la existencia de

manipulación arbitraria de datos.

(c) Kurt o curtosis. De forma similar a Skew, esta prueba argumenta que la distribución de una

votación sin manipulación arbitraria de registros debería ser aproximadamente normal. En

consecuencia, la existencia de fuertes curtosis es un indicativo de la existencia de manipulación

arbitraria.

(d) Huella dactilar de elecciones. Esta prueba es una prueba gráfica propuesta por Klimek et al.

(2012) que sugiere el uso de diagramas de dispersión del porcentaje de votos participantes en el

proceso electoral (eje x) y el porcentaje de votos para el partido o candidato ganador (eje y). Si se

identifican clústeres de datos, estos sugieren la existencia de procesos y mecanismos arbitrarios

en el proceso electoral.

(e) Test de normalidad. Esta prueba combina las pruebas de Skew y Kurt e indica que, si los valores

de Skew y Kurt se encuentran dentro de los rangos de normalidad, la votación no sufre de

comportamiento arbitrario. Para mejorar la precisión del test se pueden utilizar pruebas

estadísticas de normalidad como la prueba de Ghasemi y Zahediasl (2012).

4. ANALISIS Y RESULTADOS

Para cumplir el objetivo de este estudio inicialmente se procedió a bajar las bases de datos de la página

web del tribunal electoral de Bolivia (Organismo Electoral Plurinacional – OEP) para el Sistema de

Trasmisión de Resultados Electorales Preliminares (TREP) al 95% (22:23 del 21 de octubre de 2019) y el

Conteo Oficial (CO) al 100% (20:31 del 24 de octubre del 2019). A continuación, se procedió a remover

aquellos datos que correspondían a la votación por diputaciones para solamente analizar el conteo de

votos para presidente-vicepresidente. Como resultado se obtuvo una muestra de 33045 mesas del TREP y

34552 mesas del CO. Para la implementación de cálculos de pruebas de análisis forense electoral se

utilizó el software estadístico R. Además, debido a que los conteos de votos para los partidos con menor

votación generalmente no llegaban a dos dígitos por mesa, se realizó el cálculo solamente para el total de

votos válidos y los tres partidos con mayor votación de las bases de datos obtenidas (Movimiento al

Socialismo-Instrumento Político por la Soberanía de los Pueblos: IMAS-IPSP; Comunidad Ciudadana:

CC; y Partido Demócrata Cristiano: PDC).

4.1. Implementación de la Ley de Benford

A continuación, se presentan los resultados de la implementación de las pruebas estadísticas

relacionadas con la Ley de Benford:

(a) 2BL. Inicialmente se calculó el último dígito para la votación de cada partido para cada mesa de

la base de datos del TREP. A continuación, se calculó la media y se utilizó la prueba t de Student

de una muestra para determinar si los valores 2BL calculados los votos válidos y para cada

partido eran aproximadamente iguales al valor recomendado de 4.187 (ver Tabla 2). Como

resultado se obtuvo que ninguno de los valores 2BL se aproximan estadísticamente a 4.187 a un

nivel de confianza del 99% (p < 0.01). En consecuencia, la prueba 2BL sugiere la posible

existencia de manipulación arbitraria en la base de datos del TREP.

Posteriormente para validar los resultados obtenidos con en el sistema TREP se procedió a repetir

el procedimiento utilizando la base de datos del CO. Como muestra la Tabla 3, ninguno de los

valores 2BL para los votos válidos y los partidos cumple los criterios estadísticos recomendados

de aproximarse a la media de 4.187. En consecuencia, la base de datos del CO también sugiere la

existencia de manipulación arbitraria a un 99% de nivel de confianza (p < 0.01).

Page 9: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Tabla 2. Valores 2BL del TREP

Media t gl Valor p Media

Votos válidos

4.50

19.5

33043

< .001

0.309

MAS - IPSP

4.47

17.7

33043

< .001

0.280

CC

4.35

10.5

33043

< .001

0.166

PDC

4.38

12.1

33043

< .001

0.190

Tabla 3. Valores 2BL del CO

Media t gl Valor p Media

Votos válidos

4.50

19.7

34550

< .001

0.305

MAS - IPSP

4.47

18.3

34550

< .001

0.283

CC

4.35

10.0

34550

< .001

0.155

PDC

4.38

12.1

34550

< .001

0.186

(b) UltimoC. A continuación, se procedió a calcular la media del último dígito para la base de datos

del TREP. Inicialmente, se calculó la media e implementó la prueba t de Student de una muestra

para determinar si los valores UltimoC para los votos válidos y por partido eran

aproximadamente iguales a la media recomendada de 4.5. Adicionalmente, se eliminaron los

conteos menores a 100 votos utilizando la variable de votos válidos y siguiendo las

recomendaciones de Beber y Scacco (2012). Como resultado de la implementación de los

anteriores análisis se encontró que los valores de UltimoC para votos válidos de los partidos

MAS-IPSP y PDC no difieren significativamente del valor recomendado de 4.5 al 99% de nivel

de confianza (p > 0.01). Sin embargo, los valores de UltimoC para el CC difieren

significativamente al 99% de nivel de confianza del valor recomendado de 4.5 (p < 0.01). En

consecuencia, este último resultado sugiere que los valores del CC fueron sujetos a una

manipulación numérica arbitraria. Para validar estos resultados, se procedió a implementar el

mismo procedimiento en la base de datos del CO. Como resultado del análisis se obtuvo la Tabla

5 que, similar a la Tabla 4, muestra que con 99% de nivel de confianza, los valores de CO, MAS-

IPSP y PDC no difieren significativamente del valor recomendado de 4.5 (p > 0.01). Sin

embargo, los valores del CC difieren significativamente del valor recomendado (p < 0.01). En

consecuencia, los valores del CC para el CO presentan evidencia de haber sufrido manipulación

arbitraria de registros. Estas diferencias entre los valores de UltimoC del TREP y del CO sugieren

la existencia de manipulación arbitraria para los votos obtenidos por el partido CC.

Tabla 4. Valores UltimoC del TREP

Media t gl Valor p Media

Votos válidos

4.49

-0.347

30654

0.729

-0.00569

MAS – IPSP

4.47

-1.834

30654

0.067

-0.03013

CC

4.41

-5.661

30654

< .001

-0.09260

PDC

4.47

-1.625

30654

0.104

-0.02641

Page 10: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Tabla 5. Valores UltimoC del CO

Media t gl Valor p Media

Votos válidos

4.49

-0.634

31944

0.526

-0.0102

MAS – IPSP

4.47

-1.639

31944

0.101

-0.0263

CC

4.40

-6.236

31944

< .001

-0.0999

PDC

4.48

-1.473

31944

0.141

-0.0234

(c) C05. Posteriormente, se procedió a calcular C05 buscando valores ideales de 0.2 que indicarían

que la elección no presenta huella de manipulación arbitraria. Inicialmente se trabajaron los

valores del TREP y como muestra la Tabla 6, la prueba t de Student de una muestra indica que los

valores de votos válidos y MAS-IPSP no difieren significativamente del valor recomendado (p >

0.01). En cambio, los valores para CC y PDC difieren con un 99% de nivel de confianza del valor

recomendado de 0.2 (p < 0.01). En consecuencia, estos resultados sugieren que los valores del

TREP fueron sujetos a manipulación arbitraria para el caso específico de los partidos CC y PDC.

Tabla 6. Valores C05 del TREP

Media t gl Valor p Media

Votos válidos

0.200

-0.121

33043

0.904

-2.66e−4

MAS – IPSP

0.202

0.825

33043

0.409

0.00182

CC

0.207

3.086

33043

0.002

0.00688

PDC

0.209

3.968

33043

< .001

0.00887

A continuación, se procedió a validar los datos utilizando la base de datos de CO. Similar a la

Tabla 6, la Tabla 7 muestra, a un nivel de confianza del 99%, que los datos del CO sufrieron

manipulación arbitraria para los partidos CC y PDC porque son significativamente diferentes del

valor recomendado de 0.2 (p < 0.01). En consecuencia, C05 sugiere la presencia de manipulación

arbitraria en la base de datos del TREP y del CO para los partidos CC y PDC.

Tabla 7. Valores C05 del CO

Media t Gl Valor p Media

Votos Validos

0.199

-0.258

34550

0.796

-5.56e−4

MAS – IPSP

0.202

0.708

34550

0.479

0.00153

CC

0.207

3.224

34550

0.001

0.00703

PDC

0.209

4.138

34550

< .001

0.00905

(d) P05. Se procedió a calcular P05 para el TREP. Los resultados de la Tabla 8 muestran que para

P05, CC no se acerca al valor recomendado de 0.2 para un nivel de confianza del 99% (p < 0.01).

En consecuencia, estos resultados indican que existió manipulación arbitraria de los datos para el

partido CC.

Page 11: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Tabla 8. Valores P05 del TREP

Media t gl Valor p Media

MAS – IPSP

0.199

-0.646

33018

0.519

-0.00142

CC

0.207

3.006

33018

0.003

0.00670

PDC

0.203

1.452

33018

0.146

0.00322

Posteriormente, de igual manera que para anteriores pruebas, se utilizó la base de datos de CO

para validar los resultados obtenidos del TREP. Los resultados presentados en la Tabla 9 muestran

que para CC no se acerca al valor recomendado de 0.2 con un nivel de confianza del 99% (p <

0.01). En conjunto, los resultados del indicador P05 muestran que los datos presentan huella de

haber sufrido manipulación arbitraria para CC.

Tabla 9. Valores P05 del CO

Media t Gl Valor p Media

MAS – IPSP

0.199

-0.593

34524

0.553

-0.00127

CC

0.207

2.991

34524

0.003

0.00652

PDC

0.203

1.445

34524

0.149

0.00313

4.1.1. Conclusiones preliminares de la implementación de la Ley de Benford.

Los resultados presentados anteriormente muestran la presencia de rellenado de votos y números

inventados sugiriendo una manipulación arbitraria de registros para las bases de datos del TREP y CO

(2BL, p < 0.01). Por otro lado, ese hallazgo se relaciona con los valores de UltimoC, C05 y P05 que

también identificaron manipulación arbitraria CC y/o PDC a un 99% de nivel de confianza.

Específicamente, estos registros indican una posible manipulación arbitraria en los últimos dígitos para

los registros de votos de esos partidos (p < 0.01).

4.2. Implementación de análisis de distribuciones de votantes

A continuación, se presentan análisis relacionados con el análisis de la distribución de votantes:

(a) Unimodalidad. Esta prueba busca que la distribución de votantes sea unimodal. Sin embargo, en

caso de ser multimodal, se puede inferir la existencia procesos irregulares de manipulación

arbitraria de registros. Para ese propósito se graficaron cada una de las variables con sus

respectivos histogramas y box plots para cada partido político de la base de datos del TREP.

Como muestra la Tabla 10, todos los histogramas son unimodales con excepción del histograma

del CC que muestra una moderada bimodalidad que puede ser síntoma de la existencia de mezcla

de datos o manipulación arbitraria de registros. Por otro lado, es llamativo la existencia de colas

muy largas y valores extremos en la distribución de votos válidos. Este último resultado podría

deberse a una participación minoritaria de votantes en algunas mesas de votación, o existencia de

un amplio número de mesas de votación en lugares con poblaciones extremadamente pequeñas.

Page 12: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Tabla 10. DipT por variable para TREP

Datos Histograma Box Plot DipT

Votos validos

Distribución

unimodal y

asimétrica negativa

con presencia de

valores extremos en

la cola izquierda.

MAS-IPSP

Distribución

unimodal y

asimétrica positiva

con presencia de

valores extremos en

la cola derecha.

CC

Posible distribución

bimodal con

asimetría positiva e

inexistencia de

valores extremos.

PDC

Distribución

unimodal y

asimétrica positiva

con presencia de

valores extremos en

la cola derecha.

A continuación, se procedió a validar los resultados presentados en la Tabla 10 utilizando la base

de datos del CO (Tabla 11). En todos los casos se obtuvieron distribuciones con características

similares. En consecuencia, para DipT las distribuciones de datos del TREP y CO sugieren la

existencia de manipulación arbitraria de registros.

Page 13: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Tabla 11. DipT por variable para CO

Datos Histograma Box Plot DipT

Votos validos

Distribución

unimodal y

asimétrica negativa

con presencia de

valores extremos en

la cola izquierda.

MAS-IPSP

Distribución

unimodal y

asimétrica positiva

con presencia de

valores extremos en

la cola derecha.

CC

Posible distribución

bimodal con

asimetría positiva e

inexistencia de

valores extremos.

PDC

Distribución

unimodal y

asimétrica positiva

con presencia de

valores extremos en

la cola derecha.

(b) Skew o asimetría. Para esta prueba se calcularon los histogramas y el valor de asimetría para la

base de datos del TREP. Específicamente, cuando el valor de asimetría es significativamente

diferente de cero sugiere la existencia de manipulación arbitraria de registros. Para cumplir esa

condición se calculó la asimetría estandarizada. Específicamente, la asimetría estandarizada se

calcula dividiendo el valor de asimetría de la variable bajo análisis entre el error estándar de la

asimetría. Cuando el valor de la asimetría estandarizada es menor a -2.58 o mayor a 2.58, para

tamaños de muestra superiores a 200 (Ghasemi y Zahediasl 2012), se puede concluir que la

asimetría es significativamente diferente a cero al 95 % de nivel de confianza.

Page 14: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Tabla 12. Skew por variable para TREP

Datos Histograma Asimetría estandarizada Skew

Votos validos

-166.66

Asimetría negativa

significativamente

diferente de cero al

95% de nivel de

confianza.

MAS-IPSP

28.81

Asimetría positiva

significativamente

diferente de cero al

95% de nivel de

confianza.

CC

23.11

Asimetría positiva

significativamente

diferente de cero al

95% de nivel de

confianza.

PDC

63.04

Asimetría positiva

significativamente

diferente de cero al

95% de nivel de

confianza.

Los resultados de la Tabla 12 muestran inequívocamente la existencia de asimetrías diferentes de

cero para todas las votaciones bajo análisis. En consecuencia, se puede concluir que los datos del

TREP presentan huella de manipulación arbitraria de registros. Para validar el anterior resultado,

de igual forma que en anteriores pruebas, se procedió a realizar el mismo procedimiento con el

CO. Como muestra la Tabla 13, los resultados de Skew del CO son similares a los del TREP. En

consecuencia, Skew sugiere que existe evidencia de manipulación arbitraria para el TREP y el

CO.

Page 15: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Tabla 13. Skew por variable para CO

Datos Histograma Asimetría estandarizada Skew

Votos validos

-163.64

Asimetría negativa

significativamente

diferente de cero al

95% de nivel de

confianza.

MAS-IPSP

29.92

Asimetría positiva

significativamente

diferente de cero al

95% de nivel de

confianza.

CC

24.55

Asimetría positiva

significativamente

diferente de cero al

95% de nivel de

confianza.

PDC

64.55

Asimetría positiva

significativamente

diferente de cero al

95% de nivel de

confianza.

(c) Kurt. Esta prueba es similar a Skew porque argumenta que la curtosis de una distribución de una

votación sin manipulación arbitraria debería ser aproximadamente normal. En consecuencia, se

calcularon los histogramas y el valor de curtosis para la base de datos del TREP. En particular,

cuando el valor de curtosis es significativamente diferente de cero sugiere la existencia de

manipulación arbitraria de registros. En ese sentido se calculó la curtosis estandarizada que fue el

resultado de dividir el valor de curtosis de la variable bajo análisis sobre el error estándar de

curtosis. Luego, cuando el valor de curtosis estandarizada es menor a -2.58 o mayor a 2.58, para

tamaños de muestra superiores a 200 (Ghasemi y Zahediasl 2012), se puede concluir que la

curtosis es significativamente diferente a cero al 95 % de nivel de confianza. Los resultados de la

Tabla 14 para el TREP indican que, para todas las variables bajo análisis, el valor de curtosis es

significativamente diferente de cero al 95% de nivel de confianza. Entonces, este resultado

sugiere que el TREP presenta huella de manipulación arbitraria de registros.

Page 16: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Tabla 14. Kurt por variable para TREP Datos Histograma Curtosis estandarizada Kurt

Votos validos

167.29

Distribución

leptocurtica con

curtosis

significativamente

diferente de cero al

95% de nivel de

confianza.

MAS-IPSP

-13.49

Platicurtica con

curtosis

significativamente

diferente de cero al

95% de nivel de

confianza.

CC

-36.32

Platicurtica con

curtosis

significativamente

diferente de cero al

95% de nivel de

confianza.

PDC

23.20

Distribución

leptocurtica con

curtosis

significativamente

diferente de cero al

95% de nivel de

confianza.

De forma similar a anteriores procedimientos, para validar los resultados se procedió a utilizar la

base de datos del CO para calcular los niveles de curtosis. Como muestra la Tabla 15, todas las

variables bajo análisis tienen niveles de curtosis significativamente diferentes de cero, validando

el resultado del TREP. En consecuencia, se puede concluir que Kurt sugiere la existencia de

huellas de manipulación arbitraria en la base de datos del TREP y CO.

Page 17: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Tabla 15. Kurt por variable para CO Datos Histograma Curtosis estandarizada Kurt

Votos validos

162.88

Distribución

leptocurtica con

curtosis

significativamente

diferente de cero al

95% de nivel de

confianza.

MAS-IPSP

-13.75

Platicurtica con

curtosis

significativamente

diferente de cero al

95% de nivel de

confianza.

CC

-36.59

Platicurtica con

curtosis

significativamente

diferente de cero al

95% de nivel de

confianza.

PDC

23.48

Distribución

leptocurtica con

curtosis

significativamente

diferente de cero al

95% de nivel de

confianza.

(d) Huella dactilar de elecciones. Para esta prueba gráfica, utilizando el procedimiento sugerido por

Klimek et al. (2012), se calculó el porcentaje de votantes que ejercieron su voto (voter turnout)

vs. el porcentaje de votantes para el partido ganador (MAS-IPSP voter turnout). Específicamente,

para calcular el voter turnout se dividió el número de votos válidos entre la suma del total de

votaciones para los diferentes partidos, incluidos los votos blancos y nulos. Adicionalmente, este

método permite encontrar aquellas mesas que muestren voter turnout superiores al 100%, como

indicador de inflación de datos y consecuente manipulación arbitraria de registros.

Posteriormente, se procedió a dibujar la gráfica relacionada que se conoce como huella dactilar de

elecciones. En la Figura 1 se muestra la huella dactilar de las elecciones para el partido ganador

MAS-IPSP. La figura claramente muestra la existencia de clústeres de datos y patrones no

radiales (ver líneas punteadas en la Figura 1). En consecuencia, existen mesas que tienen voter

turnout por encima del 100%, lo cual es raro. Específicamente, se identificaron 167 mesas que

Page 18: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

tienen votaciones superiores al 100% con las siguientes características: (a) 98.2% se encuentran

en Bolivia y 0.8% en el extranjero; (b) 34.7% en Cochabamba, 25.7% en La Paz, 13.8% en Santa

Cruz y 23.1% en el resto de departamentos; y (c) con proporciones iguales de 0.6%, 1.2% y 1.8%

de mesas para diferentes unidades educativas del país. En consecuencia, basado en la huella

dactilar de elecciones del TREP se puede afirmar que existe evidencia de manipulación arbitraria

de registros. Esta manipulación arbitraria causó anomalías en los datos, mostrando votaciones

superiores a 100% y patrones en múltiplos de 0.6% para todas las mesas observadas.

Específicamente, por definición los procesos electorales se caracterizan por ser libres y justos. En

consecuencia, se espera el comportamiento de una variable aleatoria (sin patrones numéricos). Sin

embargo, la existencia de patrones numéricos en mesas problemáticas con múltiplos de 0,6 para

167 mesas es estadísticamente no “normal” y sugiere la manipulación arbitraria de registros.

Figura 1. Huella dactilar de elecciones en Bolivia para TREP

A continuación, nuevamente se procedió a validar los resultados utilizando la base de datos de

CO. Como muestra la Fig. 2, de igual manera se encontraron clústeres de datos con voter turnouts

superiores al 100% (ver líneas punteadas) y patrones no radiales. Específicamente, se

identificaron 92 mesas con problemas, donde: (a) 95.7% se encuentran en Bolivia, 2.2% en

Brasil, 1.1% en Chile y 1.1% en España (múltiplos de 1.1); (b) 28.3% en Cochabamba, 31.5% en

La Paz, 28.3% en Santa Cruz y 11.9% para el resto de departamentos; y (c) con proporciones

iguales de 1.1% y 2.2% de mesas para diferentes mesas en unidades educativas de Bolivia

(múltiplos de 1.1%). Más aún se encuentra un patrón de votación donde la mayoría de las mesas

tienen votaciones cerca al 100% de voter turnout en lugar de estar aleatoriamente distribuidas

mostrando un patrón radial. En consecuencia, basado en la huella dactilar de elecciones del CO

los resultados sugieren la presencia de huellas de manipulación arbitraria de los registros de

votación. Esta manipulación creó anomalías con votaciones superiores al 100% y patrones de

mesas en múltiplos de 0.6% para el TREP y 1.1% para el CO. Como se mencionó anteriormente,

estos patrones con múltiplos de 0.6% y 1.1% son raros al tratarse de una variable aleatoria

.

Page 19: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

Figura 2. Huella dactilar de elecciones en Bolivia para CO

(e) Test de normalidad. Para esta prueba se utilizaron los resultados de las pruebas Skew y Kurt de

tablas anteriores y determinar si la distribución por partido para el TREP y el CO se encuentran

dentro de los rangos de normalidad (Ghasemi y Zahediasl 2012) (ver Tabla 13). Más aún, para

validar los resultados sobre normalidad de datos se realizaron pruebas de normalidad adicionales

de Kolmogorov Smirnov (Lilliefors 1967). En todos los casos bajo estudio, los resultados

muestran que las distribuciones del TREP y CO no están normalmente distribuidas (Prueba de

Kolmogorov-Smirnov con p < 0.05). En consecuencia, los resultados sugieren la existencia de

huellas de manipulación arbitraria de registros.

Tabla 13. Test de normalidad por variable para TREP y CO

Datos

Asimetría

estandarizada

Curtosis

estandarizada

Prueba de

Kolmogorov-Smirnov

(valor p)

¿Distribución

Normal?

TREP CO TREP CO TREP CO TREP CO

Votos validos -166.66 -163.64 167.29 162.88 < .001 < .001 No No

MAS-IPSP 28.81 29.92 -13.49 -13.75 < .001 < .001 No No

CC 23.11 24.55 -36.32 -36.59 < .001 < .001 No No

PDC 63.04 64.55 23.20 23.48 < .001 < .001 No No

4.2.1. Conclusiones preliminares de la implementación de análisis de distribuciones de votantes

Los resultados presentados en esta subsección sugieren la presencia de anomalías en las distribuciones

de los datos de votación del TREP y CO. Específicamente, en todos los casos los indicadores bajo estudio

muestran que las distribuciones de datos no cumplen los criterios requeridos de asimetría, curtosis y

normalidad. Adicionalmente, se identificaron mesas con patrones de votación extraños que muestran

patrones de inflación porcentual similar para mesas con porcentajes de votación superior al 100%

(múltiplos de 0.6% y 1.1%).

Page 20: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

5. DISCUSIÓN Y CONCLUSIONES

En esta investigación se realizó un análisis forense electoral de Bolivia para las elecciones

presidenciales del 20 de octubre de 2019. Como resultado de la implementación de diferentes pruebas

estadísticas se encontró evidencia que sugiere la existencia de manipulación arbitraria de registros para las

bases de datos bajo estudio. Específicamente, se tienen los siguientes dos hallazgos principales:

(a) La implementación de la Ley de Benford en sus diferentes técnicas (2BL, UltimoC, C05, y P05)

sugiere la manipulación arbitraria de las bases de datos del TREP y del CO mediante un posible

rellenado de votos o inclusión de números inventados. Específicamente, la implementación de la

técnica 2BL sugiere la manipulación del segundo dígito de las bases de datos del TREP y CO. Por

ejemplo, si una mesa tenía una votación de 123 votos, se manipulo el dígito “2” y se lo cambio

por otros dígitos arbitrariamente escogidos. Adicionalmente, la técnica UltimoC presenta

evidencia de manipulación arbitraria de los registros del CC. Específicamente, UltimoC sugiere

que se manipuló el último dígito de la votación para CC. Por ejemplo, si una mesa para CC tenía

una votación de 345 votos, arbitrariamente se cambió el dígito “5” y se modificó a otros dígitos

arbitrarios. Más aun, la técnica C05, similar a UltimoC, sugiere la manipulación arbitraria del

último dígito para las votaciones de CC y PDC. Finalmente, la técnica P05 sugiere de igual

manera la manipulación arbitraria de votaciones para CC para el último dígito de sus votaciones.

En consecuencia, las técnicas relacionadas con la Ley de Benford muestran que la distribución

numérica de datos del TREP y del CO no siguen el patrón aleatorio que es común en los procesos

de votación sin manipulación arbitraria de registros (ver Hicken y Mebane (2017) y Klimek et al.

(2012) donde presentan casos similares de manipulación arbitraria electoral en otros países).

(b) Igualmente, la implementación de análisis de distribuciones de votantes muestra que las

distribuciones de datos no cumplen con las diferentes técnicas recomendadas por Hicken y

Mebane (2017) para el análisis forense electoral (DipT, Skew, Kurt, huella dactilar de elecciones,

test de normalidad). En consecuencia, las diferentes técnicas muestran que la distribución de

datos del TREP y del CO no siguen patrones comunes de elecciones sin manipulación arbitraria.

Por otro lado, mediante la huella dactilar de elecciones se encontraron mesas del TREP y del CO

que muestran tasas de votantes superiores al 100%. Específicamente, las mesas identificadas se

caracterizan por porcentajes inflados en múltiplos de 0.6% y 1.1%. Estos valores son extraños,

porque la distribución de datos en elecciones sin manipulación arbitraria no debería seguir ningún

patrón numérico al ser una variable aleatoria. Por otro lado, la existencia de votaciones

frecuentemente cercanas al 100% tampoco pasa desapercibido, porque la misma debería estar

uniformemente distribuida y mostrar un patrón radial (ver Klimek et al. 2012). En consecuencia,

las distribuciones de datos de los votantes sugieren la existencia de huellas de manipulación

arbitraria de los registros de votación.

Finalmente, hoy en día en Bolivia existen posibles errores registrados relacionados con la contienda

electoral analizada (por ejemplo, ver Aré-Vasquez 2019; Molina 2019; The Economist 2019; entre otros)

que explican los resultados de esta investigación. En consecuencia, como sugieren Hicken y Mebane

(2017), el alto número de pruebas estadísticas utilizadas que identificaron patrones que se desvían de lo

que se espera que ocurra naturalmente sugiere que las desviaciones identificadas en las bases de datos del

TREP y CO se deben a la manipulación arbitraria de los registros de los votos, en lugar del voto libre y

soberano.

6. LIMITACIONES Y FUTURAS INVESTIGACIONES

Todo estudio adolece de debilidades y el nuestro no es la excepción. Primero, el desarrollo de las

estadísticas presentadas en nuestro estudio requiere un conocimiento bastante sofisticado de los métodos

cuantitativos, así como una capacidad informática considerable. En consecuencia, deberían desarrollarse

soluciones informáticas prácticas que permitan analizar la transparencia de los resultados de procesos

Page 21: RESUMEN EJECUTIVO · Griego para entrar a la Unión Europea (Forbes 2015), operaciones de inversión fraudulenta (Matthews 2019), irregularidades en las elecciones en Rusia (The Washington

electorales actuales y futuros para un público de especialistas y no especialistas. Segundo, el análisis

forense electoral no produce una prueba definitiva de manipulación arbitraria de registros electorales. En

cambio, la observación directa del rellenado de urnas si lo hace. Sin embargo, el análisis electoral forense

produce evidencia probabilística de anomalías que sugieren una manipulación arbitraria de registros

electorales. Esta limitación no necesariamente invalida el enfoque forense electoral, porque la mayoría de

los métodos de evaluación electoral tienen la misma restricción (nuevamente, a falta de pruebas tangibles

de manipulación arbitraria). En consecuencia, las técnicas del análisis forense electoral deberían utilizarse

en conjunto con otras técnicas de auditoria electoral para converger hacia una conclusión global y ayudar

a determinar la transparencia y veracidad de los procesos electorales de un país.

REFERENCIAS

Aré-Vasquez, T. (2019). Entrevista al informático que asegura que hubo fraude en las elecciones de Bolivia:

“Se computó el voto de ausentes para favorecer a Evo Morales". Retrieved November 2, 2019, from

https://www.infobae.com/america/america-latina/2019/11/02/entrevista-con-el-informatico-que-asegura-que-

hubo-fraude-en-las-elecciones-bolivianas-se-computo-el-voto-de-ausentes-para-favorecer-a-evo-morales/

Beber, B., & Scacco, A. (2012). What the numbers say: A digit-based test for election fraud. Political

Analysis, 20(2), 211-234.

Benford, F. (1938). The law of anomalous numbers. Proceedings of the American Philosophical Society, 551-

572.

Borghesi, C., & Bouchaud, J. P. (2010). Spatial correlations in vote statistics: a diffusive field model for

decision-making. The European Physical Journal B, 75(3), 395-404.

Driscoll, A., & Nelson, M. J. (2015). Judicial selection and the democratization of justice. Journal of Law and

Courts, 3(1), 115–148. https://doi.org/10.1086/679017

Ghasemi, A., & Zahediasl, S. (2012). Normality tests for statistical analysis: a guide for non-

statisticians. International journal of endocrinology and metabolism, 10(2), 486.

Hicken, A., & Mebane, W. R. (2017). A guide to elections forensics. USAID, from

https://pdf.usaid.gov/pdf_docs/PA00MXR7.pdf

Klimek, P., Yegorov, Y., Hanel, R., & Thurner, S. (2012). Statistical detection of systematic election

irregularities. Proceedings of the National Academy of Sciences of the United States of America, 109(41),

16469–16473.

Lafleur, J.-M., & Sánchez-Domínguez, M. (2015). The political choices of emigrants voting in home country

elections: A socio-political analysis of the electoral behaviour of Bolivian external voters. Migration Studies,

3(2), 155–181.

Lazar, S. (2004). Personalist politics, clientelism and citizenship: Local elections in El Alto, Bolivia. Bulletin

of Latin American Research, 23(2), 228–243.

Lilliefors, H. W. (1967). On the Kolmogorov-Smirnov test for normality with mean and variance

unknown. Journal of the American Statistical Association, 62(318), 399-402.

Molina, F. (2019). ¿En qué se basan las acusaciones de fraude que sacuden Bolivia? El País. Retrieved

November 2, 2019 from https://elpais.com/internacional/2019/10/25/america/1572027831_226380.html

Pericchi, L., & Torres, D. (2011). Quick anomaly detection by the newcomb—Benford Law, with applications

to electoral processes data from the USA, Puerto Rico and Venezuela. Statistical Science, 502-516.

Taylor, C. (2019). The difference between descriptive and inferential statistics. Retrieved October 30, 2019,

from https://www.thoughtco.com/differences-in-descriptive-and-inferential-statistics-3126224.

The Economist. (2019). Bolivia’s baffling ballot count. The Economist. Retrieved from

https://www.economist.com/the-americas/2019/10/26/bolivias-baffling-ballot-count.

Van Cott, D. L. (2003). From exclusion to inclusion: Bolivia’s 2002 elections. Journal of Latin American

Studies, 35(4), 751–775. https://doi.org/10.1017/S0022216X03006977