El académico Ernesto San Martín, que ha criticado fuertemente la metodología de la encuesta CDEM, usa la reñida elección presidencial peruana para mostrar que la estadística no puede definir si hubo fraude o no, como los medios esperan. Pero sí puede ayudar si se fija una meta más modesta: saber cuál es la cantidad de votos fraudulentos necesaria para alterar el resultado de la elección.
Lee también Por qué CADEM no sirve para medir cambios de opinión, de Ernesto San Martín.
1 Un cambio de pregunta a propósito del fraude electoral
La segunda vuelta presidencial peruana se ha definido por un margen extraordinariamente estrecho. Según cifras reportadas por Reuters el 13 de junio de 2026, Keiko Fujimori obtuvo un 50.004% de los votos y Roberto Sánchez sumó el 49.996% (1). Cuando la diferencia entre los candidatos es de unas pocas décimas porcentuales, resulta inevitable que surjan sospechas de fraude. ¿Puede la estadística resolver esas dudas?
En una época en la que los números parecen poseer una autoridad especial, muchos creen que sí, que la estadística puede emitir veredictos definitivos en asuntos como este. Gráficos, modelos estadísticos e incluso algoritmos de inteligencia artificial son frecuentemente presentados como mecanismos capaces de revelar estas y otras verdades ocultas. La confianza no es nueva. Hace más de dos siglos, el matemático Nicolás de Condorcet advertía sobre la actitud de muchas personas que, al encontrarse con cifras en un texto político, las consideraban «una especie de talismán”.
«[…] et je vois encore des gens de bon sens que dès qu’ils voient des chiffres dans un livre politique se sentent tout prêts à croire comme par une espèce de talisman»
La observación conserva toda su actualidad. En materia electoral, no son pocos quienes esperan que la estadística actúe precisamente como un talismán: que examine los datos y emita un veredicto definitivo acerca de la existencia o inexistencia de fraude.
El problema es que esa expectativa descansa sobre un supuesto extremadamente fuerte: que conocemos cómo debería lucir una elección completamente normal, libre de irregularidades. Dicho de otro modo, para afirmar que una elección presenta patrones anómalos, primero deberíamos disponer de una teoría capaz de describir cómo se distribuyen los votos en ausencia de fraude. Pero, a diferencia de lo que ocurre con fenómenos naturales, no existe una teoría de esta naturaleza. No existe una ley del comportamiento electoral comparable a la ley de gravitación.
Esta dificultad ha sido reconocida por diversos especialistas y organismos internacionales. Por ejemplo, el Report on the Identification of Electoral Irregularities by Statistical Methods de la Comisión de Venecia, publicado en 2018, advierte que no existe una «física» de las preferencias políticas y del comportamiento electoral contra la cual contrastar los resultados observados. Por esta razón, los métodos estadísticos de detección de fraude descansan inevitablemente sobre hipótesis cuya validez resulta difícil o imposible de verificar empíricamente. En consecuencia, la estadística rara vez puede ofrecer la certeza que se le atribuye.
¿Significa esto que la estadística es inútil en el campo de las irregularidades electorales? No necesariamente. Pero sí implica que debemos cambiar la pregunta y, en consecuencia, ofrecer una respuesta modesta.
En un reciente trabajo titulado Detecting Electoral Irregularities: Necessary Conditions from Partial Identification proponemos abandonar la pregunta tradicional —¿hubo fraude?— y reemplazarla por otra más modesta, pero también más informativa: ¿qué magnitud mínima de fraude habría sido necesaria para alterar el resultado electoral observado?
La diferencia parece sutil, pero es fundamental. La primera pregunta exige determinar algo que los datos por sí solos difícilmente pueden revelar. La segunda busca identificar una condición necesaria. No pretende demostrar que hubo fraude ni demostrar que no lo hubo. Busca cuantificar la mínima intervención que habría sido necesaria para cambiar al ganador oficialmente observado.
Una situación análoga ocurre cuando una persona pierde un vuelo. Una pregunta consiste en intentar reconstruir exactamente qué ocurrió: si salió tarde de su casa, si hubo congestión vehicular o si el control de seguridad tomó más tiempo de lo habitual. Otra pregunta, mucho más modesta, consiste en determinar cuánto retraso habría bastado para perder el avión. Esta última no explica lo que efectivamente ocurrió, pero sí identifica una condición necesaria para que el desenlace observado hubiera sido posible. Nuestra propuesta adopta una lógica similar: no intenta demostrar que hubo fraude, sino calcular cuál habría sido la mínima magnitud necesaria para alterar el resultado electoral observado. Lo que proponemos es que esta forma de pensar, que tal vez no parece muy útil para la vida puede ser un aporte real de la estadística para orientar las investigaciones sobre fraude electoral.
2 De los votos observados a los votos reales
Hagamos un poco de modelamiento estadístico. Si sospechamos que en una elección hubo fraude, o alguna irregularidad en el conteo final de los votos válidamente emitidos, entonces debemos distinguir tres proporciones:
- La proporción de fraude, que denotaremos por f.
- La proporción de votos que cada candidato realmente obtuvo, que llamaremos . Esta es la proporción que refleja la voluntad de los electores.
- La proporción de votos observados para cada candidato, que llamaremos . Esta es la proporción que corresponde a los datos oficiales que se publican una vez hecho el conteo de votos.
¿Cómo se relacionan estas tres proporciones? Dartevelle, San Martín & Van Bellegem (2026) han demostrado, sin hacer supuestos acerca del comportamiento de los electores, que estas tres proporciones se relacionan de la siguiente manera:

Este intervalo contiene todas las posibles proporciones de votos reales de un candidato en función de las proporciones observadas y la tasa de fraude; se denomina cota inferior, mientras que se denomina cota superior.
Ilustremos este resultado suponiendo que en una elección se contabilizaron 10.000.000 de votos válidamente emitidos. Supongamos además que se observó que un candidato obtuvo el de las preferencias, es decir, obtuvo 5.400.000 votos. Si supiéramos que 300.000 votos son fraudulentos (es decir, ), entonces tenemos que considerar dos casos:
- Si los 300.000 votos fueron contabilizados a favor del candidato que oficialmente obtuvo el de las preferencias, entonces para obtener la votación que realmente obtuvo, es necesario restar los 300.000 votos a los 5.400.000 votos, resultando 5.100.000 votos, esto es, el 51%. Esto corresponde precisamente a la cota inferior del intervalo (1), a saber .
- Si, por el contrario, 300.000 votos que nuestro candidato realmente obtuvo fueron contabilizados en favor de otro candidato, entonces para obtener la cantidad de votos que realmente obtuvo, es necesario sumar a los 5.400.000 votos, 300.000 votos, resultando 5.700.000 votos, esto es, el 57%. Esto corresponde a la cota superior del intervalo (1), a saber .
Pero todo este razonamiento depende de una información que, en la práctica, no tenemos: ¿cuántos votos fueron afectados por fraude?
3 Cuando el fraude no basta para cambiar al ganador
La discusión pública suele asumir que la existencia de fraude implica necesariamente que el resultado de una elección es incorrecto. Sin embargo, ambas afirmaciones son conceptualmente distintas. Una elección puede haber estado afectada por irregularidades y, aun así, conservar el mismo ganador. La razón es simple: no toda magnitud de fraude es suficiente para alterar el orden observado entre los candidatos.
Para ilustrar esta idea, consideremos los resultados de la segunda vuelta peruana entre Roberto Sánchez y Keiko Fujimori quienes, según cifras reportadas por Reuters el 13 de junio de 2026, obtenían 49.996% de los votos (esto es, 9.034.743 votos) y 50.004% de los votos (esto es, 9.036.046 votos), respectivamente.
Aunque la magnitud del fraude sea desconocida, todavía es posible identificar situaciones en las cuales cualquier nivel plausible de fraude resulta insuficiente para cambiar el resultado observado.
La discusión de la sección anterior puede aplicarse ahora a ambos candidatos simultáneamente. Si la tasa de fraude es , entonces la proporción verdadera de votos obtenida por Roberto Sánchez debe pertenecer a un intervalo de valores plausibles determinado por su proporción observada de votos y por la magnitud del fraude. Lo mismo ocurre con Keiko Fujimori. En consecuencia, para cada valor posible de , obtenemos un intervalo de valores plausibles para la proporción verdadera de votos de cada candidato.
Figura 1

La idea central es que la tasa de fraude puede ser insuficiente para que dichos intervalos se intersecten. Mientras los intervalos permanezcan separados, cualquier valor compatible con los datos sigue asignando a Keiko Fujimori una proporción verdadera de votos superior a la de Roberto Sánchez. En otras palabras, aun admitiendo la existencia de fraude, el orden observado entre los candidatos necesariamente se mantiene. La Figura 1 ilustra esta situación.
4 ¿Cuánto fraude sería necesario para cambiar al ganador?
La dificultad es evidente: los intervalos dependen de la tasa de fraude y, sin embargo, esa cantidad es precisamente la que desconocemos. ¿Cómo obtener entonces información útil acerca de una magnitud que no observamos?
La cuestión relevante es determinar la tasa mínima de fraude para que los intervalos de valores plausibles de las proporciones verdaderas de votos comiencen a intersectarse. Mientras los intervalos permanezcan separados, cualquier escenario compatible con los datos conserva el mismo orden entre los candidatos. La primera intersección ocurre cuando la cota superior del intervalo de proporciones verdaderas de votos de Roberto Sánchez supera la cota inferior del intervalo correspondiente a Keiko Fujimori. Esta situación se ilustra en la siguiente Figura 2.
Figura 2

Esta condición permite calcular directamente la tasa mínima de fraude necesaria para que aparezca por primera vez la posibilidad de invertir el resultado observado. El resultado es particularmente simple: dicha tasa es igual a la mitad de la diferencia observada entre las proporciones de votos de ambos candidatos.
5 Aplicación a la segunda vuelta peruana
Aplicado a los resultados de la segunda vuelta peruana descritos anteriormente, la diferencia observada entre ambos candidatos es igual a 0.008 puntos porcentuales. En consecuencia, la tasa mínima de fraude es igual a 0.004% de los votos emitidos. En términos absolutos, ello corresponde a 652 votos. Dicho de otro modo, sólo una manipulación de esa magnitud o superior podría generar por primera vez la posibilidad de invertir el orden observado entre los dos candidatos.
La cifra puede parecer sorprendentemente pequeña. Sin embargo, existe una razón simple. Cuando una irregularidad consiste en trasladar un voto desde un candidato hacia otro, el efecto sobre la diferencia electoral es doble: un candidato pierde un voto y el otro gana uno. En el caso peruano, la diferencia observada es de 1.303 votos. Por ello, 652 votos desplazados bastarían para transformar una derrota por 1.303 votos en una victoria por un voto.
La interpretación de esta cifra puede verificarse directamente. Si se identificaran 652 votos que hubiesen sido atribuidos erróneamente a Keiko Fujimori y se los restituyera a Roberto Sánchez, entonces Fujimori perdería 652 votos y Sánchez ganaría 652 votos. En consecuencia, Sánchez habría obtenido 9.035.395 votos mientras que Fujimori habría obtenido 9.035.394 votos: Sánchez ganaría por un voto.
Este resultado no demuestra que haya existido fraude. Tampoco demuestra que la elección haya sido limpia. Lo que proporciona es una condición necesaria para que una eventual manipulación pudiera haber alterado el resultado. Más aún, proporciona una referencia concreta para orientar eventuales recuentos o investigaciones posteriores: en el caso peruano, sería necesario identificar al menos 652 votos fraudulentos para que aparezca por primera vez la posibilidad de una inversión del resultado observado. Una vez identificada esta magnitud crítica, pueden desarrollarse análisis más específicos —auditorías de actas, revisión de mesas, inspección de procedimientos electorales o técnicas tradicionales de election forensics— para evaluar si una intervención de tal magnitud resulta plausible dadas las circunstancias concretas de la elección.
6 De las certezas imposibles a las incertidumbres cuantificables
Más allá del caso peruano, la principal lección es quizás de carácter epistemológico. Durante décadas, la discusión sobre fraude electoral ha estado dominada por la búsqueda de pruebas estadísticas capaces de establecer con certeza la existencia o inexistencia de manipulación. Sin embargo, tales pretensiones exigen algo que rara vez se explicita: una teoría científica capaz de describir cómo deberían distribuirse los votos en una elección completamente normal. Cuando esa teoría no existe, conviene ser cautos frente a afirmaciones categóricas, por sofisticados que parezcan los métodos estadísticos utilizados.
La alternativa no consiste en abandonar la estadística, sino en comprender mejor cuáles son sus posibilidades y sus límites. En lugar de producir certezas donde éstas no son posibles, la estadística puede identificar incertidumbres relevantes para la toma de decisiones.
Desde esta perspectiva, la pregunta ya no es si los datos prueban o refutan la existencia de fraude. La pregunta es qué tan vulnerable es un resultado electoral frente a posibles irregularidades y qué magnitud deberían alcanzar éstas para alterar el desenlace observado. Lejos de constituir una renuncia al análisis científico, este cambio de enfoque representa una comprensión más realista de sus posibilidades y límites.
Después de todo, en democracia, como en muchas otras áreas de la vida pública, las decisiones rara vez se toman en presencia de certezas absolutas; se toman a la luz de la evidencia disponible y de las incertidumbres que aún permanecen abiertas.

NOTAS Y REFERENCIAS
(1) Associated Press, 9 de junio de 2026: 50.055% versus 49.945%, diferencia inferior a 20.000 votos sobre más de 17,8 millones de votos contabilizados.


Ernesto San Martín