A. El problema
Las encuestas para la elección presidencial 2025 son muchas y distintas. Cada empresa encuestadora tiene sesgos. Las encuestas más antiguas se desactualizan, y la idea es predecir el resultado de la primera vuelta en base a este pool de encuestas. La idea central es observar cómo funcionan las encuestas a lo largo del proceso electoral y, al final, validar cuáles resultaron más precisas. La precisión de las encuestas se medirá comparando sus resultados con los votos oficiales, usando métricas como el error promedio en porcentajes (MAE) y si acertarán a los candidatos a segunda vuelta.
B. Cómo funciona el modelo
El modelo no se limita a promediar encuestas. Incorpora varias capas de corrección estadística para hacerlas comparables y más realistas. En primer lugar, transformamos los porcentajes a un espacio matemático llamado ALR. Esto se debe a que los votos no son variables independientes, ya que siempre deben sumar 100%. La transformación nos permite trabajar en un espacio sin esa restricción y manejar mejor la información. Luego, distinguimos entre dos tipos de incertidumbre. La primera es el error de muestreo, que depende del tamaño de cada encuesta. La segunda es la volatilidad real del electorado, que refleja cambios genuinos en las preferencias. Para separar ambas usamos el método delta, que traduce cómo se propaga la incertidumbre matemática desde las proporciones a las coordenadas transformadas. También corregimos el efecto-casa, es decir, los sesgos sistemáticos de cada encuestadora. Si una empresa tiende a sobreestimar a un candidato de manera constante, el modelo lo detecta y ajusta con una técnica de regresión ridge, que aplica una penalización para evitar exagerar la corrección. A todo esto, se suma un sistema de ponderación que considera multiples criterios: las encuestas más recientes pesan más (con una vida media de 21 días), también se considera su calidad metodológica y el tamaño de la muestra. Así se construye un peso final que equilibra recencia (peso mayor a encuestas más recientes), rigor y representatividad. Finalmente, reconocemos que las encuestas reales son más variables de lo que predice la teoría clásica. Por eso incorporamos un factor de sobredispersión y aplicamos regularización matricial para estabilizar los cálculos. Esto asegura que las matrices de varianza sean bien definidas y que el modelo se mantenga robusto en todas las simulaciones.
C. Candidatos considerados
Artés, Jara, ME-O, Parisi, Matthei, Kast, Kaiser y Mayne-Nicholls.
D. Resultados simulados y estimaciones probabilísticas
Corre 10,000 simulaciones para proyectar escenarios probables.
Entrega para cada candidato: promedio esperado, intervalos de confianza, probabilidad de quedar primero o segundo.
Calcula la probabilidad total de pasar a segunda vuelta.
E. Implementación técnica:
Programado en R con librerías especializadas (MASS, ggplot2)
Se actualiza automáticamente con nuevas encuestas
Usa semilla fija para cálculos reproducibles y auditables
F. Debilidades
Falta de validación histórica. No se ha incorporado el historial de precisión de las encuestas en el pasado dentro del modelo. Esto permitiría ver qué tan certeras son estas proyecciones en la práctica.
Eventos impredecibles: El modelo no puede anticipar escándalos, cambios súbitos de última hora, o acontecimientos externos que alteren drásticamente las preferencias electorales.
Brecha intención-voto real: Las encuestas miden intención de voto, pero el comportamiento real puede diferir por abstención diferencial, voto estratégico, o cambios de opinión en la zona privada de votación.
G. Resultados del Modelo: 1 de septiembre 2025
Nota: Los intervalos de confianza que se muestran son más amplios que los márgenes de error de cada encuesta individual, porque el modelo incorpora no solo la incertidumbre muestral, sino también la variabilidad entre distintas encuestadoras y la dinámica temporal. Además, se han usado parámetros conservadores en el modelo, lo que amplía deliberadamente la estimación de la incertidumbre. A medida que aumente el número de encuestas consistentes en el tiempo, estos intervalos tenderán a reducirse.
H. Encuestas Consideradas: 1 de septiembre 2025
I. Distribuciones Simuladas: 1 de septiembre 2025
J. Probabilidades de Clasificación: 1 de septiembre 2025