¿Cómo votarán los catalanes? Una predicción del 27S a partir de las encuestas

El próximo domingo se celebran unas elecciones transcendentales en Cataluña y muchas preguntas permanecen abiertas: ¿logrará Junts pel Sí una mayoría absoluta? ¿Quién será la segunda fuerza? ¿Qué porcentaje de votos lograrán los independentistas?

A continuación abordo esas preguntas usando un modelo estadístico de predicción. Básicamente utilizo los datos de las encuestas para estimar cúantos diputados logrará cada partido y con qué probabilidad.

Un vistazo al modelo de predicción

Mi modelo basa sus predicciones en una veintena de sondeos electorales que se han publicado en las últimas semanas.

El modelo trabaja en cuatro pasos. El primer paso es calcular los votos de cada partido según una media de sondeos. Así, en lugar de fiarnos de una única encuesta, busco el consenso entre todas. Después aproximo el porcentaje de voto de cada partido en cada provincia, usando la distribución que observaron el CIS y otras encuestas. El tercer paso consiste en incorporar incertidumbre al modelo para que sea cauto cuando calcula probabilidades. ¿Pero cúal es la imprecisión típica de las encuestas? Para averiguarlo he estudiado siete elecciones distintas de los últimos años.

El cuarto y último paso consiste en ejecutar el modelo y hacer 15.000 simulaciones de las elecciones del domingo. En cada simulación genero los votos de cada partido y provincia a partir del azar, la media de encuestas y la incertidumbre esperada. A partir de esos votos, y aplicando la ley D’Hondt, asigno los escaños de Barcelona, Tarragona, Girona y Lleida.

A continuación tenéis los resultados de ese proceso.

La predicción de escaños tras 15.000 simulaciones

El primer gráfico muestra los escaños que logrará cada partido y con qué probabilidad.

seats (Cada gráfico es un histograma. El eje x representa el número de diputados del partido y la altura de las barras indica la probabilidad de que un partido logre ese número de escaños.)

Según el modelo, el resultado más probable es que Junts pel Sí (JxSí), la coalición formada por CDC y ERC, logre 63 escaños. Pero no sería raro que el partido se quedase en 59 diputados o se fuese hasta 67 (ése es el intervalo donde estarán sus resultados con un 50% de probabilidad).

El segundo partido será Ciutadans con 20 diputados y detrás vendrían Catalunya Sí que es Pot (CSP) (15), PSC (14), PP (12) y la CUP (9).

Sin embargo, podéis observar que distintos resultados son altamente probables. Ciutadans podría caer hasta los 17 escaños o irse hasta los 23. CSP tiene un 25% de probabilidades de lograr más de 18 diputados y si fuese segundo no sería una enorme sorpresa. El PSC tiene su horquilla probable en un amplísimo 11-17, el PP en 11-15 y la CUP en 6-10.

Destaca, además, el caso de Unió porque es dificilísimo de predecir. Según el modelo, el partido de Durán i Lleida tiene un 55% de probabilidades de quedarse fuera del parlamento. Casi como echar una moneda al aire. Si logra entrar, lo más probable es que se lleve 3 o 4 diputados (22% probabilidad), pero podría lograr 6 o más con un 12% de probabilidad, que es pequeña pero no nula.

(Nota. Estos datos de escaños se calculan a partir de los datos de votos. Si queréis ver la incertidumbre de los porcentajes de voto, los tenéis representados aquí.)

JxSí y la CUP: ¿mayoría de escaños o de votos?

Las encuestas sugieren que Junts pel Sí no logrará los 68 diputados que dan la mayoría absoluta aunque se quedará cerca. ¿Pero qué probabilidad tiene exáctamente? ¿Y si formase una alianza con la CUP? Una ventaja de tener un modelo de simulación es que podemos calcular estas probabilidades. En el siguiente gráfico tenéis la distribución de escaños de JxSí y su suma con la CUP.

mayoria dip

La probabilidad de que Junts pel Sí logre 68 escaños o más es del 21%. Lo más probable es que no lo logre, pero si lo consigue no sería una tremenda sorpresa. Más probable es que la suma de JxSí y la CUP alcance la mayoría: según el modelo, eso ocurre en el 72% de las simulaciones.

También podemos usar el modelo para responder otra de las preguntas que se discuten estos días: el porcentaje de votos que sumarán los partidos independentistas. Como podéis ver en el siguiente gráfico, la probabilidad de que JxSí y la CUP logren la mayoría de votos es del 21%.

mayoría votos

Los diputados en cada provincia

Aunque he presentado primero los resultados de toda Cataluña, en realidad el modelo simula cada una de las cuatro provincias por separado. Muestro esos resultados a continuación. El primer gráfico representa los 85 escaños que se reparten en la provincia de Barcelona.

barna

Barcelona es con diferencia la provincia más poblada en Cataluña (el 75% del censo vive allí) y también la que más diputados tiene asignados (85, un 63% del total). Allí los partidos logran diputados de forma casi proporcional a sus votos y por eso las distribuciones son suaves.

Podéis observar que es en Barcelona donde Unió tiene más opciones de lograr sus diputados. Conseguirá dos o más diputados por Barcelona en el 45% de las veces.

Veamos ahora los 18 diputados de Tarragona:

tarragona

En Tarragona hay menos escaños y por tanto menos dudas. JxSí obtendrá 8 o 9 diputados con un 70% de probabilidad. Ciutadans obtendrá problemente 3 (aunque podrían ser uno más o uno menos), CSP uno o dos escaños, los mismos que el PSC. El PP obtendrá probablemente dos y la CUP uno. Unió tiene un 80% de probabilidades de quedarse sin diputado por Tarragona.

A continuación los escaños en Girona.

girona

En Girona se reparten 17 escaños, de los cuales 11 irían para JxSí (que podrían ser 10-12). Ciutadans obtendrá uno o dos. CSP probablemente uno, aunque podría quedarse sin ninguno (21%) o lograr dos (18%). El PSC y el PP lograrán probablemente uno cada uno y quizás dos. La CUP seguramente uno (60%), aunque podría quedarse sin él (30%).

Por ultimo, la provincia menos poblada es Lleida, aunque está sobrerepresentada y reparte 15 diputados. Allí las dudas más grandes son si Ciutadans logrará uno o dos diputados y si CSP se quedará fuera o logrará un diputado. En función de ambas cosas, JxSí logrará 9, 10 u 11 diputados. Por su parte, PSC, PP y la CUP parece que obtendrán uno cada uno.

lleida

Conclusión

Para acabar me gustaría reconocer una derrota: es imposible predecir las elecciones con total precisión. Podemos usar encuestas para asignar probabilidades a ciertos sucesos (que un partido logra cierto número de escaños o que sea el más votado) pero no hacer predicciones exactas porque por lo general múltiples resultados son posibles. La incertidumbre tiene tres fuentes principales: los indecisos, los que no responden y quienes cambian su voto durante la última semana.

El problema es similar al de las predicciones meteorológicas: el lunes podemos estimar la probabilidad de que llueva el sábado e incluso acertar, pero no sabremos con certeza si va a llover. Por eso los modelos como el mío hacen predicciones probabilísticas. (Eso significa, por cierto, que este domingo no sabremos si mi modelo funciona o fracasa porque para saberlo tendría que ponerlo a prueba varias veces.)

Y sin embargo las encuestas son el mejor instrumento disponible para entender la realidad electoral. Ocurre que a veces tenemos unas expectativas irreales sobre su precisión y olvidamos que las encuestas intentan algo complejísimo: anticipar cómo votarán millones de personas cuando ni siquiera esas personas lo saben con seguridad.

Metodología.

El modelo de predicción consiste en una secuencia de cuatro paso.

1. Obtener un promedio de sondeos. Al agregar muchas encuestas conseguimos dos cosas: eliminamos el error de muestreo y en lugar de confiar en la cocina de un encuestador hacemos entre todas una cocina de consenso. La media de encuestas la calculo ponderada por fecha y tamaño de muestra. Podéis leer los detalles de este paso aquí. Las encuestas que he usado provienen de trece encuestadoras: Sigma Dos, GAPS, GESOP, NC Report, Invymark, IBES, Feedback, CIS, Metroscopia, DYM, GAD3, My Word, Celeste Tel.

2. Aproximar el porcentaje de votos en cada provincia. Para eso he usado la distribución de votos por provincias según CIS y las encuestas de NC-Report y Sigma Dos.

3. Incorporar incertidumbre al modelo. Este paso es fundamental para calcular probabilidades. Consiste, en esencia, en averiguar cuál es la imprecisión típica o esperable de un promedio de encuestas. Para calcular eso he analizado siete elecciones de los últimos años, calculando un promedio de sus encuestas y observando los errores que esos promedios cometieron. La incertidumbre la incorporo como un error de distribución normal con una desviación típica que varía entre 1,5 y 4 en función del porcentaje de votos del partido (los errores son generalmente mayores para partidos con más votos). Una parte de la incertidumbre la asumo propia de la provincia y otra parte (la mayor) común a las cuatro.

4. Simular. El último paso consiste en ejecutar el modelo y hacer 15.000 simulaciones de las elecciones. En cada simulación genero los votos de cada partido y provincia a partir del azar, la media de encuestas y la incertidumbre que he asumido. A partir de esos votos, y aplicando la ley D’Hondt y la barrera mínima del 3% de votos, asigno los escaños de Barcelona, Tarragona, Girona y Lleida.


También en EL ESPAÑOL: