AMÉRICA LATINA

El análisis estadístico de las elecciones de Bolivia. Una orientación al debate

Marzo 12, 2020 | Por: Rodrigo Salazar Elena

Antecedentes

 

El pasado 10 de noviembre, Evo Morales renunció a la presidencia de Bolivia después de haber sido declarado ganador en la elección del 20 de octubre.  Habría sido su cuarto perído presidencial, tercero bajo la Constitución de 2009. En el sistema electoral boliviano se contempla una segunda ronda entre los dos candidatos más votados, salvo que el candidato en primer lugar obtengo al menos 40% de los votos y una ventaja de 10 puntos sobre el competidor más cercano.

 

De manera similar al PREP mexicano, en Bolivia existe el sistema de Transmisión de Resultados Electorales Preliminares (TREP), cuya finalidad es mantener informada a la ciudadanía del conteo acumulado de los votos en la medida en que se va recibiendo la informción de los centros de votación. Los resultados definitvos son los provenientes del cómputo oficial. Sin embargo, el TREP es una garantía de transparencia global del proceso. En un proceso normal, las autoridades pueden hacer el cómputo oficial sin excesivas presiones precisamente porque los resultados preliminares dan una idea de lo que cabe esperar.

 

A las 7:40 pm del 20 de ocutubre, por disposición de la autoridad electoral el TREP fue suspendido. Se había contabilidad un 87.8% de las actas y Evo Morales tenía 45.3% de los votos con una ventaja de 7.1 puntos sobre Carlos Mesa. A las 6:30 de la tarde del día siguiente, las autoridades anunciaron resultados actualizados, daban a Morales la ventaja de 10 puntos sobre Mesa, lo necesario para evitar una segunda vuelta que, según diversas encuestas, habría perdido.

 

Como una forma de atender las protestas que se siguieron de inmediato, el gobierno acepto que la Organización de Estados Americanos llevara a cabo una auditoría de la elección. El 10 de noviembre, la OEA presentó un informe preliminar en el que recomendaba la reposición del proceso, dadas las irregularidades detectadas.

 

El “informe MIT”

 

El 8 de noviembre, el Center for Economic and Policy Research (CERP), un think tank, publicó un análisis estadístico de los resultados en el que se concluía que no hubo fraude. En ese momento generó alguna atención, pero rápidamente fue olvidado por la fluidez de los eventos en Bolivia. El 27 de febrero pasado, la auditaría de la OEA fue puesta en cuestión por un artículo, firmado por Jack R. Williams y John Curiel, investigadores del MIT, el cual fue pubicado por el blog The Monkey Cage, propiedad del Washington Post. El post remite a una versión más extensa del estudio, que de hecho se puede encontrar en la página del mismo CEPR. Ahí se aclara que el CEPR contrató a los investigadores para hacer una “verificación independiente” del estudio de noviembre. Invito a los lectores a comparar los documentos y juzgar por sí mismo que se trata, salvo en un par de detalles, de una réplica del mismo análisis.

 

Sin embargo, el prestigio del MIT y del Washinton Post fue suficiente para que muchos comentaristas tomaran por buena la conclusión a la que había llegado el CEPR antes: que no había evidencia suficiente de fraude. Hay que recordar que la auditoría de la OEA presenta evidencia de distintas irregularidades. El estudio estadístico es sólo una parte del análisis. En ese sentido, al concentrar la discusión en este aspecto, el efecto propagnadístico del relanzamiento del análisis del CEPR.

 

Finalmente, la estadística es una materia que requiere de un entrenamiento que la mayoría de nosotros no tiene, por lo que al tomar partido en disputas sobre estos temas muchos nos guiaremos por cuestiones como la reputación y el presitigio. Los autores del estudio son (más o menos) cuidadosos de no involucrar a su institución. Sin embargo, tanto la cancillería mexicana como el presidente de Argentina, al cuestioonar a la Secretaría General de la OEA se refieren a un “informe realizado por el MIT”.

 

El análisis de la OEA

 

El 10 de marzo, el encargado del estudio estadístico de la OEA, Irfan Nooruddin, publicó también en The Monkey Cage una explicación del procedimiento utilizado.

 

El tono de buena parte del debate desde el relanazamiento del análisis del CERP llega a poco menos que afirmar que el MIT hizo un análisis de gran rigor científico mientras que el realizado por la OEA es un artifico sin ningún fundamento. Los resultados pueden ser debatibles, pero se trata de un estudio realizado por un experto en el tema, con una técnica de análisis debidamente justificada y que aplicó antes para detectar irregularidades en la claramente fraudulente elección presidencial de Honduras de 2017, tamnbién a solicitud de la OEA.

 

Al interumpirse la transmión de los datos, se habían contabilizado un 88% de los votos, como se mencionó antes. Muestra Nooruddin que en el 95% de voto acumulado Morales aún no había alcanzado la ventaja del 10% sobre Mesa, y es en el último 5% de los votos contabilizados la logra. En este grupo, Morales obtuvo 167 mil votos adicionales, mientras que Mesa sumó 50 mil. A nivel nacional, según los datos oficiales, por cada 100 votos de Mesa Morales obtuvo 130. En el este grupo del último 5%, por cada 100 votos de Mesa Morales obtuvo 334.

 

Aunque el dato en sí es muy llamativo, no basta para concluir intervención indebida. El reporte CEPR-MIT tiene razón al remachar una y otra vez que el primer 95% y el restante 5% representan a grupos de votantes que son muy distintos, y las diferencias entre ellos están relacionadas con su comportamiento electoral. Por ejemplo, las regiones rurales podrían tener más peso en el último 5% que en el resto anterior. Las regiones rurales suelen estar más apartadas y eso explica que sus votos se contabilicen al final. Al mismo tiempo, los votantes rurales suelen tener preferencias electorales diferentres a los urbanos. En Bolivia, el voto rural es típicamente facvorable a Morales (De hecho, poco antes de que se vovieran a reportar resultados, Morales anunció que, gracias al voto campesino…).

 

Entonces, no se puede saber hasta qué punto la diferencia en la votación entre los dos grupos se debe a estas diferencias en las características de los votantes y hasta qué punto se deben a una intervención fraudulenta, por ejemplo, manipulando las actas.

 

La técnica utilizada en el análisis eastadístico de la OEA está diseñada precisamente para descontar el efecto de esas características. Para entender cómo funciona, recurro a un ejemplo clásico. Digamos que se asignara una beca a todos los estudiantes que acabaron la preparatoria con un promedio de por lo menos ocho y se quiere valorar si esa beca ayuda a los beneficiarios a tener un mejor desempeño escolar en la universidad. Parece natural comparar las calificaciones universitarias entre quienes reciben la beca y quienes no la reciben. Pero los no beneficiarios obtuvieron menos de ocho en la preparatoria, y los beneficiarios obtuvieron entre ocho y diez. Eso quiere decir que los grupos son distintos en las condiciones que llevan a tener buen desempeño en la preparatoria, como motivación, inteligencia y condiciones familiares, condiciones que también influirán en el desempeño universitario. Entonces, si se observara que los beneficiarios tienen, por decir algo, 2.5 puntos más de calificación en promedio que los no beneficiarios, ¿hasta qué punto esa diferencia se debe a la beca y no a que los beneficiarios ya eran, en principio, buenos esudiantes?

 

Una alternativa es centrarse en los estudiantes que están justo en el umbral de obtener la beca y justo antes de obtener.¿Qué tan diferentes puden ser en motivación e inteligencia los estudiantes que obtuvieron justo ocho de los que estuvieron a una centésima de la nota mínima? En esta frontera, es más razonable esperar que la obtención o no de la beca se deba a la suerte que a diferencias sistemáticas entre los estudiantes. Justo a un lado y otro del ocho, las características que distinguen a los buenos estudiantes serán, en promedio, similartes. Por ello, si se observara una diferencia en la calificación universitaria promedio, se justifica atribuir esta diferencia a lo único que claramente distingue a los dos grupos justo a ambos lados del ocho: precisamente que unos recibieron la beca y otros no.

 

Esto es lo que hace el análisis estadístico de la OEA. Por ejemplo, la diferencia en la votación por Morales, comparando los datos justo en el 95% acomulado es de unos 10 puntos porcentuales. La idea subyacente aquí es que, si no hubiese habido una interveción deliberada, la ventaja de Evo Morales tendría que haber sido la misma justo en el umbral del 95%, pues alrededor de ese umbral, en promedio, las características de los votantes son las mismas.A esto se le conoce como “supuesto de continuidad”, y tanto los investigadores del MIT como los del CEPR han afirmado que no les parece justificado.

 

En The Monkey Cage Williams y Curiel dicen que podría ser que los votantes del último 5% terminan su jornada laboral más tarde o que en general son más pobres. Los invesitgadores del CEPR han afirmado en redes sociales que la geografía da cuenta de las diferencias. El problema con estos argumentos es que son válidos para explicar las diferencias globales en la votación de los votantes del último 5% con respecto al resto del país, pero no para explicar el salto observado justo en el 95%. Al igual que la motivación o la inteligencia de los estudiantes alrededor del ocho, factores como el horario de trabajo o el nivel de ingreso de los votantes serán, en promedio, los mismos justo alrededor del 95%.

 

Una refutación del análisis de la OEA tendría que mencionar qué característica distingue claramente a los votantes a un lado y otro del umbral, como para dar cuenta del salto de alrededor de 10%. Un test estadístico que mostrara un salto o “discontinuidad” en el 95% de otros factores que no tendrían que ser afectados por un pretendido fraude (votaciones pasadas, por ejemplo) pondría en duda la concusión de que la diferencia es imputable a la interevencion indebida de las autoridades.

 

Otra posibilidad es mostrar que antes de que se interrumpiera el TREP se registran saltos similares, indicando que, por algún factor desconocido, la relación entre los votos y el momento en que se obtiene la información es irregular, y no se justifica la sospecha de fraude. Finamente, podría ser que los resultados fuesen muy sensibles a decisiones como qué distancia con respecto al umbral del 95% se escoge para realizar la comparación y qué función se elige para incorporar la tendencia en los calculos. También hay pruebas para eso.

 

Mi punto es que existe todo un repertorio de técnicas conocidas para valorar la solidez de las conclusiones del análisis de la OEA, y apropiadas para el método estadístico utilizado para la auditoría. Es por esta razón que resulta un poco frustrante que el CEPR-MIT insista en discutir diferencias en grupos distintos al umbral o, en última, escudarse en que el supuesto de continiuidad no es “convincente”. La posibilidad de presentar contraevidencia sólida existe, y no recurrir a ella es una elección.

 

En el reporte de Curiel y Williams se afirma: “Después de realizar una reproducción de los resultados de la OEA y de las simulaciones de lo que el apoyo a Morales podría haber representado basándonos en la votación previa a la detención del TREP, aseguramos que no podemos encontrar evidencia alguna de una tendencia irregular.”

 

Cuando Curiel y Williams dicen “Después de realizar una reproducción de los resultados de la OEA”, supongo que se refieren a un documento posterior, pues estas no aparecen en el publicado a fines de febrero. En él se aborda más directamente el diseño de la OEA, pero:

 

1) Utilizando un umbral distinto al de 95% y

2) Mostrando que en los recintos de votación que no reportaron votos antes de la interrupción del TREP, en comparación con el resto, el habla del español el acceso al agua, la asistencia a la escuela y el acceso a internet son menores. O sea, otra vez, esas zonas son distintas.

 

La forma aceptada para refutar a la OEA, ya que se tienen esas variables es verificar si cualquiera de ellas presenta un salto en el umbral del 95% como el registrado en la votación. Si esto fuera el caso, podría afirmarse que el cambio en la votación se debe a un factor distinto al fraude. La renuencia a realizar la prueba que daría la contraevidencia más convincente escapa a mi comprensión.

 

Las simulaciones del informe CEPR-MIT

 

El análisis más comentado del documento de Williams y Curiel es el resultado de mil simulaciones según las cuales la ventaja de 10% de Morales sobre Mesa está dentro de lo que cabe esperar dada la tendencia observada antes de la interrupción del TREP.

 

Pero las “simulaciones” no se realizan de la nada. Siguen un procedimiento y existen distintas alternativas entre las que alguien tuvo que escoger. Es natural preguntarse qué procedimiento se siguió. En el documento de Curiel y Williams de febrero de 2020 no se describe el método de simulación. Este es descrito muy bien en el informe de noviembre de 2019.

 

Para conocer la gama de resultados factibles condicional a los resultados en el momento de interrupción del TREP, a las mesas de votación que no alcanzaron a reportar resultados se les imputa un resultado. Se asume que los resultados de los centros de votación de la misma localidad tienen resultados muy similares. Entonces, a cada mesa que no reportó resultados se le imputa el resultado de un centro de votación que reportó sus resultados al TREP antes de la interupción, escogido al azar dentro de la misma localidad. Si ninguno de los centros de votación de una localidad reportó resultados, a cada uno se le asigna el resultado de un centro de votación del mismo municipio, escogido al azar. Se repite el proceso 1000 veces, y eso genera 1000 resultados electorales distintos, que en promedio le dan una ventaja de 10.5 puntos porcentuales a Morales (me encantaría conocer el intervalo de confianza de 95%, pero ninguno de los informes lo reporta).

 

En principio, no veo objeciones en el método, que de hecho es altamente sofisticado. En la defensa de sus resultados, no obstante, los investigadores del CEPR parecen encontrar cuestionable el hecho en sí de que el anáisis de la OEA respose en un supuesto (el de continuidad). Pero no existe método de análisis cuya validez no repose en supuestos. En este caso, los propios autores afirman que “En la medida en que se sostengan nuestros supuestos de que en areas geográficas similares el voto es aproximadamente similar, el rango de resultados obtenido por sustitución aleatoria refleja de manea razonable el rango para el voto real”.

 

Entonces, el análisis de la OEA es válido si aceptamos que, justo en el corte de 95%, los votantes en promedio son similares en sus características. Pero el análisis del CEPR-MIT no está libre de supuestos. Sus resultados son válidos si aceptamos que los centros de votación geográficamente contiguos tendrán resultados similares, a pesar de que son distintos en cuanto al reporte de los votos al TREP.

 

Se podrían plantear dos objeciones. La primera es que el supuesto es menos plausible a medida que se reduce la contigüidad geográfica. Es decir, la imputación ente mesas de votación de la misma localidad es más confiable que la imputación entre localidades del mismo municipio. Alguien que realmente hiciera una verificación independiente revisaría qué tanto influyen estas últimas en el resultado.

 

La segunda objeción es más importante. Centrémonos en una localidad en la que algunas mesas de votación reportaron al TREP antes de la interrupción y otras no. ¿Se puede afirmar que esta diferencia es totalmente debida al azar? ¿No es posible que esa diferencia refleje otras diferencias que a su vez tengan que ver con los patrones de votación? La objeción que dan Williams y Curiel sobre la duración de jornadas de trabajo es perfectamente aplicable a los centros de votación de una misma localidad. Pero si estas diferencias sistemáticas existen, entonces no es el caso que cualquier centro de votación de la misma localidad puede dar cuenta de la votación el centro que no reportó los resultados.

 

Si uno lee un titular como “Simulaciones de especialistas del MIT demuestran que Evo ganó en la primera vuelta”, suena como si estuvieran lanzando cohetes al espacio. No es así, ni de lejos. Por un lado, el análisis de la OEA no ha sido debidamente refutado. Por el otro, el análisis del CEPR-MIT es válido sólo si uno está dispuesto a creer en un supuesto que es por lo menos tan difícil de sostener como el de la auditoría de la OEA.

 

Se puede hacer mucho aún por entender lo que pasó en la elección boliviana mediante análisis estadístico. Por lo pronto, Curiel ha hecho públicos sus datos y su código, lo que habla muy bien de él. Esto permitirá a los interesados, como yo y gente mucho más talentosa, continuar con el análisis y el escrutinio mutuo, espero que cada vez más con el ánimo de saber colectivamente qué pasó que con el objetivo de desacreditar a un rival.

EDICIÓN IMPRESA
Blog y Voto

El no registro

Por: Mtro. Carlos Carvallo

Septiembre 14, 2020

Justicia

riesgos en la elección

Por: Armando I. Maitret Hernández

Septiembre 23, 2020

Proceso de renovación INE

Consejeras y consejeros del INE. ¿En qué nos quedamos? ¿A dónde vamos?

Por: Fernando Díaz Naranjo

Junio 10, 2020

Género y política

La paridad

Por: Dania Paola Ravel Cuevas

Septiembre 21, 2020

Proceso electoral 2020 - 2021

campañas en tiempo

Por: Karolina M. Gilas

Septiembre 07, 2020

SÍGUENOS EN TWITTER
SÍGUENOS EN FACEBOOK