¿Acertaron las encuestas del 27S? Un repaso a sus cifras y a nuestra predicción

g2

Las elecciones catalanas se presentaban complicadas para los encuestadores. Eran unos comicios excepcionales y es difícil hacer estádistica de lo excepcional. Concurrían nuevos partidos, la participación se presumía histórica y el sentido del voto era para muchos inédito: un plebiscito. Pero las encuestas hicieron un buen trabajo. Aquí explico por qué.

También en EL ESPAÑOL:

Nota. Que un modelo probabilístico se demuestre bien calibrado es en esencia otra forma de precisión. Pero para los propósitos de este artículo he creído que la distinción entre precisión y calibración era útil.

Radiografía del resultado: así votó Cataluña en su noche más decisiva

comarcas_indepen

Artur Mas convocó las elecciones del 27S con la intención de impulsar el proceso soberanista. Pero menos de la mitad de los votantes ha respaldado a las dos listas que defendían abiertamente la independencia: Junts pel Sí y la CUP. Aquí la mejor radiografía de la cita electoral: datos, análisis y contexto. 

Las elecciones catalanas se presentaban complicadas para los encuestadores. Eran unos comicios excepcionales y es difícil hacer estadística de lo excepcional. Concurrían nuevos partidos, la participación se presumía histórica y el sentido del voto era para muchos inédito: un plebiscito. Pero las encuestas hicieron un buen trabajo. Aquí explico por qué.

1. El promedio de sondeos funcionó.

El gráfico compara 20 sondeos con los resultados de las elecciones del domingo. Los sondeos son los de Sigma Dos, GAPS, GESOP, NC Report, Invymark, IBES, Feedback, CIS, Metroscopia, DYM, GAD3, Celeste Tel y My Word.

g1

El promedio de encuestas anticipó la imagen general que dejaron las urnas. JxSí, el PP y CUP fueron bien estimados. Tambien el PSC. La mayor desviación se dió con Ciudadanos y Catalunya Sí que es Pot (CSP). El primero había sido infraestimado y el segundo sobreestimado, justo al revés de lo que pasó en las municipales de mayo.

2. Nuestro modelo fue razonablemente preciso.

Basándome en los sondeos, publiqué dos días antes del 27S un modelo de predicción para las elecciones. El modelo estimaba cuántos diputados lograría cada partido y con qué probabilidad.

A continuación evalúo que tal lo hizo ese modelo. El gráfico compara los diputados de cada partido con las predicciones probabilísticas del modelo.

g2

(Las áreas de color son histogramas y representan la probabilidad que tiene cada partido de lograr cierto número de escaños.)

La precisión del modelo fue notable. Acertó el partido ganador, acertó quién sería segundo y el orden de todos los partidos excepto el PSC y CSP, que se intercambiaron. La predicción más probable se desvió menos de dos escaños para JxSí, PSC, PP, CUP y Unió. Las mayores desviaciones se dieron con Cs y CSP. Pero desde el principio sus resultados eran los más inciertos: sus distribuciones de probabilidad eran las más anchas.

El modelo predijo también los resultados del independentismo. Anticipó que JxSí no tendría mayoría absoluta y que la suma con CUP lograría mayoría de escaños pero no de votos. Sus predicciones mediana para los escaños de JxSí y la CUP casi coinciden con los resultados reales.

Captura de pantalla 2015-09-30 a las 23.48.26

También las predicciones de votos:

g4

Estoy también satisfecho con las predicciones en cada provincia. En Barcelona la precisión fue similar a la general. En Tarragona la predicción de más probabilidad acertó para JxSí, PSC, CUP y Unió. En Lleida, para PSC, PP, CUP, Unió y JxSí. En Girona, para todos los partidos. (Gráficos de Barcelona, Tarragona, Lleida y Girona.)

3. Un reloj parado.

Mi primer objetivo con el modelo es que fuese fiable. Sus predicciones no son audaces ni finísimas: son cautas. Por eso había muchos resultados posibles en el segundo gráfico. No es así por capricho. Es así porque observar las encuestas de los últimos años me sugiere que ésa es la precisión que podemos esperar.

Estos eran los intervalos del 50% de probabilidad que el modelo asignaba a cada partido:

  • JxSí: [59, 67]
  • Cs: [17, 23]
  • CSP: [12, 18]
  • PSC: [11, 17]
  • PP: [11, 15]
  • CUP: [ 6, 10]
  • Unió: [ 0, 3]

Son intervalos amplios e incluso así la mitad de las veces la realidad debía acabar fuera de ellos. Por eso las desviaciones con Ciutadans o CSP no son una sorpresa. Al final, de los siete partidos cinco cayeron dentro de los intervalos. Y aunque no puedo saberlo todavía, creo que la incertidumbre del modelo está bien calibrada.

¿Pero qué significa «bien calibrada»?

Mi modelo respeta el primer principio que enuncia Nate Silver para hacer estimaciones electorales: «Un buen modelo debe ser probabilístico, no determinista». La mayoría de modelos de predicción tienden al exceso de confianza y mi propósito es no caer en ese error. Por eso mi modelo no da predicciones muy concretas si no puede —y generalmente no puede— sino predicciones con distintas probabilidades.

Para calibrar un modelo probabilístico hay que comprobar que sus predicciones aciertan con la probabilidad prevista. Por ejemplo, si mi modelo dice que el partido X tiene un 60% de probabilidades de lograr escaños, quiero que eso suceda un 60% de las veces. Si sucede solo el 10% de las veces el modelo está mal. Pero también está mal si sucede el 95% del tiempo. Ese modelo está mal calibrado.

Podéis pensar en las predicciones meteorológicas. No espero que el hombre del tiempo me diga con certeza si lloverá el sábado. Pero si me dice que la probabilidad de lluvia es del 20%, lo que espero es que acierte cuatro de cada cinco veces.

En resumen, al evaluar la bondad de un modelo probabilístico podemos hablar de dos cosas: de su precisión y de su calibración. Un modelo es muy preciso si dice exactamente qué va a ocurrir. Esos modelos son geniales, pero difíciles de encontrar para fenómenos complejos. Por eso las elecciones se predicen con modelos probabilísticos. Y esos modelos quiero que estén bien calibrados: si me dicen que un suceso tiene una probabilidad del 66%, deberán acertar dos de cada tres veces.

4. Conclusión.

Tras las elecciones el modelo de predicción sale reforzado. Sus limitaciones siguen ahí —y de ellas hablaré otro día— pero sus predicciones para el 27S fueron bastante precisas.

Si el modelo falló fue más bien por acertar demasiado. Quizás el modelo está ligeramente mal calibrado y fue demasiado conservador. O lo que es más probable: quizás tuvo algo de suerte. Si la razón es una u otra sólo lo sabremos dentro de muchas tiradas, cuando podamos distinguir la estructura del azar.

_____________

También en EL ESPAÑOL:

Nota. Que un modelo probabilístico se demuestre bien calibrado es en esencia otra forma de precisión. Pero para los propósitos de este artículo he creído que la distinción entre precisión y calibración era útil.

Así votarán los catalanes según el promedio de los últimos sondeos

votoEl próximo domingo se celebran unas elecciones catalanas de especial trascendencia por el carácter plebiscitario que les dan las fuerzas independentistas. A continuación analizo lo que nos dicen las últimas encuestas sobre esos comicios.

El próximo domingo se celebran unas elecciones catalanas de especial trascendencia por el carácter plebiscitario que les dan las fuerzas independentistas. A continuación analizo lo que nos dicen las últimas encuestas sobre esos comicios.

1. La estimación de votos

En el primer gráfico muestro las estimaciones de voto según 20 sondeos publicados desde julio. Además incluyo un promedio de los sondeos ponderado según el tamaño de muestra y la fecha de cada uno.

voto(Nota: la metodología es similar a la que he usado para las elecciones generales.)

Según las encuestas, la candidatura donde se integran ERC y Convergència, Junts pel Sí, lograría alrededor del 40% de los votos. Detrás vendrían Ciutadans (15%), Catalunya Sí que es Pot (12%) —la coalición formada por ICV, EUiA, Equo y Podemos—, el PSC (11%), el PP (10%), la CUP (7%) y Unió (3%).

2. La estimación de escaños

En las últimas semanas también se han publicado varias estimaciones de escaños que recojo en el siguiente gráfico.

esc

Según los sondeos, Junts pel Sí no lograría la mayoría absoluta, que está fijada en 68 escaños. Pero sacaría alrededor de 63 y tendría una amplísima ventaja sobre el resto de partidos. Ciutadans sería la segunda fuerza con 20 escaños, seguida de CSP (15), PSC (14), PP (13), CUP (8) y Unió (0-2).

Estas estimaciones de escaños, sin embargo, deben tomarse con cautela porque pequeñas variaciones en los votos pueden modificarlas mucho.

3. La suma de JxSí y la CUP en votos y en escaños

Acabamos de ver que la suma de JxSí y la CUP no supera el 50% de votos en las encuestas. Pero los dos partidos que proponen ir hacía la independencia sí sumarían una mayoría de escaños en el Parlament de Cataluña.

mayorias

En el gráfico he incluido la suma de fuerzas de JxSí y la CUP en los sondeos. La encuesta de GAPS es la única que da una mayoría de votos. En cambio todas las encuestas excepto dos de NC Report les dan una mayoría de escaños.

4. La evolución del voto

Para acabar, en este último gráfico represento la evolución de las estimaciones de voto desde principios de julio hasta hoy.

serie

Durante la campaña se observa una subida de JxSí y de la CUP, aunque muy ligera (alrededor de un 1% cada uno). La celebración de la Diada y el resto de eventos en estas dos semanas parecen haber reforzado a los partidarios del independentismo.

Del resto, el único movimiento lo protagoniza Catalunya sí que es Pot, la coalición de Podemos e ICV, que no sólo no habría conseguido potenciar su marca durante la campaña sino que habría retrocedido ligeramente.

En resumen, las últimas encuestas apuntan a que JxSí ganará las elecciones aunque no logrará la mayoría absoluta. Sí la alcanzaría con el apoyo de la CUP, aunque no es seguro que la organización de izquierdas vaya a investir a Artur Mas como president. Las encuestas dicen también que Ciutadans será la segunda fuerza, seguido de Catalunya sí que es Pot. Sin embargo, la relativa novedad de ambos partidos hace que sus previsiones se rodeen de más incertidumbre que las del resto.

También en EL ESPAÑOL:

Así son los catalanes que votarán el 27S. Una radiografía en cinco gráficos.

Así votarían los españoles: suben PP y PSOE pero el bipartidismo sigue en mínimos históricos

uno

Retroceden los partidos emergentes y avanzan los tradicionales. No obstante, el avance de PP y PSOE es sólo relativo. El bipartidismo sigue en mínimos históricos: la suma de los dos grandes partidos nunca ha bajado del 60% de votos en unas elecciones generales y las encuestas presagian ahora un 52%.

Quedan tres meses para las generales y en Cataluña arranca ya una precampaña de facto. Desde ahora y durante el otoño van a sucederse los acontecimientos: habrá elecciones en Grecia y luego en Cataluña, conoceremos datos económicos y casos de corrupción. Todo eso en el escenario electoral más convulso de las últimas décadas. Pero, ¿cuál es el punto de partida? ¿Cómo votarían los ciudadanos si estuvieran llamados hoy mismo a las urnas?

A continuación tenéis el promedio de encuestas que estoy haciendo en EL ESPAÑOL. El primer gráfico muestra el promedio y las 15 encuestas más recientes, incluidas varias de esta semana. El resultado es un escenario con cuatro partidos escalonados: PP (28%), PSOE (25%), Podemos (17%) y Ciudadanos (12%).

uno

(Observaréis que existen grandes diferencias entre encuestas: ésa es la razón por la que hacemos un promedio de consenso. El promedio es una media de 75 encuestas ponderadas por fecha y muestra cuyos detalles podéis encontrar en la metodología.)

El gráfico anterior es la foto fija del momento. Pero podemos observar también como ha ido evolucionando el apoyo de cada partido desde 2014. Aunque el ruido de las encuestas oculta las tendencias, éstas emergen nítidas en el promedio.

dos

En el gráfico vemos que el PP mantiene una línea ascendente y que gana tres o cuatro puntos desde abril. También el PSOE mejora, quizás más lentamente.

En cambio, Podemos retrocede desde el inicio de 2015. En diciembre llegó a ser la segunda fuerza, pero ha perdido simpatizantes y cae de aquel 25% de voto estimado al 17%. El partido de Pablo Iglesias pierde un tercio de sus apoyos, aunque se mantiene tercero con holgura. Detrás viene Ciudadanos, que también retrocede desde su máximo de abril.

Ésas son las tendencias actuales: retroceden los partidos emergentes y avanzan los tradicionales. No obstante, el avance de PP y PSOE es sólo relativo. El bipartidismo sigue en mínimos históricos: la suma de los dos grandes partidos nunca ha bajado del 60% de votos en unas elecciones generales y desde 1993 superó siempre el 70%. Las encuestas presagian ahora un 52% de voto para la suma de PP y PSOE y eso haría de las elecciones de diciembre las menos bipartidistas de la democracia.

tres

¿Pero a qué se debe el avance del PP y el PSOE en los últimos meses? Se han propuesto al menos tres explicaciones diferentes, aunque no excluyentes.

Para algunos, el avance tiene que ver con la economía: desde hace unos meses los ciudadanos somos menos pesimistas con la situación del país, lo que estaría beneficiando al PP, dado que es el partido en el gobierno, pero curiosamente también al PSOE, como alternativa cauta, en cuanto que es conocida.

Una segunda explicación sería la novedad de Podemos y Ciudadanos. Estos partidos habrían disfrutado de una luna de miel y por un tiempo no sufrieron la oposición de otros partidos ni fueron sometidos al total escrutinio de los medios. Pasado ese periodo, su imagen habría empeorado y por eso pierden votantes.

La tercera explicación es que la proximidad de las elecciones haya recuperado votos para el PP y el PSOE. Cuando las urnas se veían lejos, algunos encuestados habrían declarado un voto más expresivo o de protesta que real. Ahora, al acercarse las elecciones, esos votantes podrían haber ido recuperando sus simpatías partidistas tradicionales.

Estas tres hipótesis presagian un avance del PP y el PSOE en los próximos meses: las elecciones estarán cada vez más cerca, Podemos y Ciudadanos no volverán a ser nuevos y la economía es probable que mejore. Sin embargo, las intenciones de los votantes se moverán por otros motivos y con sucesos sobre los que nada sabemos como el resultado en Cataluña o las campañas electorales. Además los votos estarán muy repartidos y el parlamento muy fragmentado, dos circunstancias que al acercarse las elecciones podrían inducir movimientos de voto útil.

Desde EL ESPAÑOL iré actualizando el promedio de encuestas, desde ahora y durante el otoño, para tratar de alumbrar esas incógnitas.


Metodología: por qué y cómo promediar encuestas. La razón para promediar las encuestas se intuye viendo su gran variabilidad. Sondeos de fechas similares se desvían unos de otros y esas desviaciones apenas reflejan cambios de los votantes. Así se observa en el gráfico de barras (el primero del artículo): en los puntos no vemos tendencias sino una nube ruidosa. El ruido lo provocan los errores de muestreo y los diferentes ajustes que hace cada encuestador (la llamada cocina). Es decir, los cambios de una encuesta a la siguiente se deben más al azar y al criterio de sus técnicos que a cambios de los encuestados. Por eso no podemos sacar grandes conclusiones de una encuesta.

La alternativa es promediar encuestas. De esa forma reducimos el error de muestreo y consensuamos los criterios de los encuestadores. El resultado es más parsimonioso y libre de ruido, y capturará mejor la corriente de profundidad: los cambios lentos en la intención de voto de los encuestados.

Detalles del promedio. Nuestro promedio es una media ponderada según la muestra y la fecha de cada sondeo. Además aplico dos ajustes según la empresa encuestadora: doy menos peso a las firmas sin datos históricos y corrijo lo que se conoce como house effects. De los cuatro factores que afectan al peso de las encuestas, la fecha es el más importante. El resto tienen efectos menores y sirven sobre todo para saber que esos factores no son determinantes.

El peso de una encuesta en el promedio depende sobre todo de su fecha. Un ejemplo: para calcular el promedio del 1 de julio uso la información de todas las encuestas de semanas anteriores y posteriores, pero dando más peso a las encuestas más cercanas a ese día. El peso de cada encuesta decae exponencialmente con los días, con una constante de tiempo de 28 días, de forma que una encuesta pierde la mitad de su peso a los 20 días.

También tengo en cuenta la muestra de cada encuesta, de forma que las que hicieron más entrevistas reciben más peso. Este efecto es pequeño porque los datos nos dicen que la muestra no es un gran predictor de la precisión de una encuesta.

Pensando en asignar peso a cada encuesta he analizado también la precisión histórica de cada empresa encuestadora. Los resultados que he obtenido son poco concluyentes y por lo tanto no doy pesos individuales a cada encuestadora. El único ajuste que introduzco consiste en dar un 18% más de peso a las encuestas de firmas de las que tengo al menos cinco encuestas en el histórico, porque mi análisis sugiere que esas firmas han sido mejores en sus predicciones. Para estimar esto he analizado la precisión de diferentes encuestadoras en las elecciones generales de 2011, las europeas de 2014 y una parte de las municipales y autonómicas de 2015. Este peso extra que doy a algunas encuestadoras tiene un efecto pequeño en el promedio.

Por último, también corrijo las encuestas de lo que se conoce como house effect -la tendencia de cada encuestadora a desviarse del promedio de encuestas de forma sistemática durante una elección-. Estas desviaciones son absolutamente legítimas y pueden deberse, por ejemplo, al método de recogida de datos del encuestador y a los criterios técnicos con que tratan a los votantes indecisos. Al corregir estos efectos evito que el orden en que se suceden las encuestas afecte demasiado a nuestro promedio. Es decir, intento que los movimientos del promedio no se deban a los votantes y no al encuestador.

Los 4 gráficos que debes ver para comprender la encuesta del CIS

CIS estimado b

Las estimaciones del CIS reafirman un escenario con cuatro partidos escalonados. El PP sigue primero y crece (28,2%) y el PSOE también avanza (24,9%). En cambio, Podemos (15,7%) y Ciudadanos (11,1%) retroceden con respecto a abril.

El CIS ha publicado este miércoles sus estimaciones de voto para las elecciones generales. A continuación incluyo los datos en la serie completa desde principios de 2012.

CIS estimado b

Las estimaciones del CIS reafirman un escenario con cuatro partidos escalonados. El PP sigue primero y crece (28,2%) y el PSOE también avanza (24,9%). En cambio, Podemos (15,7%) y Ciudadanos (11,1%) retroceden con respecto a abril.

No te fíes de una sola encuesta

Aunque la del CIS es una buena encuesta, sigue siendo sólo una. Contiene errores por muestreo y porque los ajustes de sus técnicos -la llamada cocina- nunca es perfecta. Afortunadamente, esos errores podemos aminorarlos con un promedio de varias encuestas. Así logramos dos cosas: reducir el error de muestreo y hacer una cocina de consenso.

A continuación incluyo los datos actualizados del promedio de encuestas que estoy haciendo en EL ESPAÑOL. En el primer gráfico muestro las 11 encuestas más recientes (incluida la del CIS) y nuestro promedio.

promedio 1

La media de sondeos dibuja un escenario muy similar al CIS: PP (27%), PSOE (24%), Podemos (18%) y Ciudadanos (13%). El CIS estima algo más de voto para los dos partidos tradicionales y menos para las formaciones emergentes. Además, asigna más votantes a los partidos pequeños.

En el siguiente gráfico podéis ver las tendencias de nuestro promedio de sondeos desde finales de 2014. El promedio es una media de las encuestas ponderadas por el tamaño de su muestra y por su fecha. Pesan más las encuestas más recientes y aquellas cuya muestra es mayor.
promedio 2

En el gráfico se ven las grandes tendencias del año y los movimientos desde mediados de junio. El PP y el PSOE han frenado la tendencia ascendente y se mantienen relativamente planos. Lo mismo pasa con los partidos emergentes, que paran así la caída que arrastran desde hace varios meses (Podemos desde principios de año y Ciudadanos desde el mes de abril).

Intención directa de voto vs. estimaciones

Mi opinión sobre la validez de las encuestas es conocida: creo que son nuestro mejor instrumento para conocer el clima electoral. Ni son infalibles ni son siempre precisas, pero a veces están muy acertadas y en general son más informativas que cualquier alternativa.

En cambio, otras personas desconfían de las encuestas. Sobre todo de la cocina: los ajustes de los encuestadores para hacer sus estimaciones. Aquí debajo incluyo las cifras crudas. Es decir, las respuestas de intención directa de voto antes de pasar por la cocina según la serie del CIS desde 2012.

CIS idv

Estos datos son útiles para observar tendencias pero predicen mal el voto.

La intención directa no refleja bien el comportamiento de los entrevistados. Algunas personas no tienen decidido su voto y prefieren agarrarse al no sabe antes que indicar su voto más probable. Otras prefieren no revelar sus intenciones. Sin embargo, los analistas pueden hacer una estimación fundamentada de cómo votarían esas personas. En eso consiste la cocina: en combinar información auxiliar (como las simpatías partidistas del entrevistado) y conocimiento sobre comportamiento electoral, para predecir cómo votarán los indecisos. Así se produce una predicción más precisa. No es un ejercicio sencillo ni único (y por eso diferentes firmas difieren en sus ajustes) pero casi siempre mejora las predicciones.

Por eso en nuestro promedio usamos las estimaciones de cada encuestador y no sus datos crudos. Confiamos en sus cocinas y no guisamos nosotros. Lo único que hacemos es promediar su resultados para buscar un consenso, una suerte de cocina de fusión.

________________

Metodología: por qué y cómo promediar encuestas. La razón para promediar las encuestas se intuye viendo su gran variabilidad. Sondeos próximos en el tiempo se desvían unos de otros y esas desviaciones apenas reflejan cambios de los votantes. Así se observa en el gráfico de barras (el segundo del artículo): en los puntos no vemos tendencias sino una nube ruidosa. El ruido lo provocan los errores de muestreo y las diferencias de criterio entre los encuestadores de cada firma. Es decir, los cambios de una encuesta a la siguiente se deben más al azar y a los encuestadores que a cambios de los encuestados. Por eso no podemos sacar grandes conclusiones de una encuesta.

La alternativa es promediar encuestas. De esa forma reducimos el error de muestreo y consensuamos los criterios de los encuestadores —sus cocinas—. El resultado es una señal parsimoniosa, sin ruido, que puede capturar la corriente de profundidad: los cambios lentos en la intención de voto de los encuestados.

En particular, nuestro promedio es un media ponderada según la muestra y la fecha de cada sondeo. Un ejemplo: para calcular el promedio del 1 de julio uso información de todas las encuestas de semanas anteriores y posteriores, pero dando más peso a las encuestas más cercanas a ese día. También tengo en cuenta la muestra de cada encuesta, de forma que las que hicieron más entrevistas reciben más peso. Por último, si hay varias encuestas del mismo encuestador, reduzco el peso de todas menos la más cercana al 1 de julio, para que una firma que hace más sondeos no domine demasiado al resto.

¿Trias o Colau? Una predicción de sus votos y sus alianzas

concejales bcn

Los resultados anteriores prevén que ni CIU ni Barcelona en Comú lograrán la mayoría. Eso abre la puerta a pactos para nombrar al próximo alcalde de la ciudad. Sin embargo, la simulación apunta a que las coaliciones naturales no serán suficientes para sumar los 21 ediles necesarios.

También en EL ESPAÑOL:

En Barcelona votarán este domingo para elegir a su alcalde. Según las encuestas, el primer puesto se lo disputan CIU y Barcelona en Comú, la plataforma izquierdista que lleva a Ada Colau como candidata. Los dos partidos están muy lejos de lograr una mayoría que les garantice la alcaldía.

Como en el caso de Madrid, eso deja dos posibilidades. Varios partidos que sumen 21 concejales -la mayoría más uno- pueden acordar el alcalde entre sus candidatos. Si no hay un acuerdo de ese tipo, la alcaldía será para la fuerza más votada, previsiblemente Xavier Trias o Ada Colau.

A continuación describo una simulación de las elecciones al ayuntamiento de Barcelona. Los resultados nos servirán para analizar las posibilidades de cada candidato.

Los votos según las encuestas

Empiezo revisando las estimaciones de voto. El primer gráfico muestra un promedio de los sondeos del último mes que han publicado los institutos Metroscopia, Sigma dos, GESOP, GAD3 y Feedback.

encuestas bcn

El gráfico refleja la dispersión de las encuestas. Esa dispersión se debe al menos a tres factores: los errores de muestreo, los cambios temporales y las diferencias en los ajustes que hace cada encuestador: lo que conocemos como la cocina.

Al agregar los sondeos, esta dispersión disminuye pero la incertidumbre no desaparece. Como ya expliqué al hablar del caso de Madrid, los sondeos y los resultados pueden desviarse por muchas otras razones. Es posible, por ejemplo, que todas las encuestas se equivoquen en la misma dirección o que durante esta semana los electores tomen decisiones imprevistas. Por estas razones, antes de hacer una predicción debemos asumir que no sabemos lo suficiente como para ser precisos.

Añadiendo incertidumbre

A continuación utilizo la media de las encuestas para predecir cuántos concejales logrará cada partido. Pero antes añadiremos una incertidumbre hipotética. Partiendo del promedio de votos, hago 10.000 simulaciones añadiendo varianza según los márgenes de error y cierta incertidumbre. La distribución de votos que resulta puede verse en este gráfico.

Los resultados de la simulación se muestran a continuación. El gráfico representa el número de concejales que lograría cada uno de los partidos.

concejales bcn

El primer partido sería CIU con alrededor de 10 concejales. Apenas uno más de los que obtendría Barcelona en Comú. Sin embargo, ambos partidos pueden ganar y perder otro concejal con mucha facilidad e incluso alejarse bastante de esa horquilla. Lo que se antoja muy difícil a la luz de las encuestas es que uno u otro logre la mayoría absoluta, que está fijada en 21 concejales.

Hasta cinco partidos más podrian obtener representantes en el ayuntamiento. Ciutadans lograría alrededor de cinco y siete, el PSC cinco o seis, ERC y el PP sobre cuatro o cinco. Además, la CUP tendrían alrededor de un 70% de posibilidades de lograr algún concejal.

Posibles mayorías 

Los resultados anteriores prevén que ni CIU ni Barcelona en Comú lograrán la mayoría. Eso abre la puerta a pactos para nombrar al próximo alcalde de la ciudad. Sin embargo, la simulación apunta a que las coaliciones naturales no serán suficientes para sumar los 21 ediles necesarios.

mayorias bcn

Un pacto entre CIU, ERC y la CUP no sería suficiente para conseguir los 21 concejales. Tampoco un hipotético acuerdo entre Barcelona en Comú y el PSC.

Con tanta fragmentación, las únicas alianzas posibles serían entre socios a priori sorprendentes. Un acuerdo a cuatro bandas entre CIU, ERC, la CUP y el PSC tendría un 42% de lograr la mayoría. Las mismas que  un acuerdo entre Barcelona en Comú, PSC y Ciutadans.

Lo extraño de estos acuerdos hace que quedar primero sea fundamental. Porque si ninguna alianza sale adelante, el alcalde será el candidato más votado. Previsiblemente Trias o Colau. ¿Pero cuál de los dos tiene más probabilidades? Las encuestas no se ponen de acuerdo. Pero si hacemos caso de ellas, nuestro modelo dice que el más votado será Trias con una probabilidad del 71%.

También en EL ESPAÑOL:


Nota. Para acabar, permitidme repetir la nota de precaución. Es importante recordar que las probabilidades que he calculado se basan en asumir una incertidumbre hipotética. Si las encuestas fallasen por un margen aún más amplio, los resultados del próximo domingo pueden ser distintos. Creo que eso es improbable pero lo único seguro es que es posible: en las urnas no hay ningún voto todavía.

Algunos detalles técnicos. En las 10.000 simulaciones parto de una media de las seis encuestas del último mes. Para generar la variabilidad por muestreo uso una distribución normal de desviación estándar tal que replico los márgenes de error considerando la muestra total (truncada para evitar negativos). Los márgenes de error los estimo a partir del porcentaje de voto promedio de cada partido (no uso el peor caso). A esa variabilidad añado otra que representa la incertidumbre asumida. Esa incertidumbre corresponde con una distribución normal de media cero y desviación estándar 0,25 + 0,15 votos. Eso implica asumir que el intervalo del 95% para los votos de cada partido es: ±(0,5+0,15 votos). La distribución de votos que resulta de añadir esta variabilidad por muestre e incertidumbre puede verse en este gráfico. En cada una de las 10.000 iteraciones, a partir de los votos calculo el reparto de concejales aplicando la regla D’Hondt y la barrera mínima del 5%.

Así votarán los andaluces: el cálculo de escaños más completo

fig 7b

Los andaluces elegirán este domingo su Parlamento autonómico. El PSOE aventaja con claridad al PP pero no alcanza la mayoría y serán necesarios pactos para gobernar. A continuación analizo los sondeos más recientes y llevo a cabo tres simulaciones de resultados para discutir cómo podría quedar configurado el nuevo Parlamento andaluz.

Los andaluces elegirán este domingo su Parlamento autonómico. En las últimas horas se han publicado sondeos de los institutos DeimosCeleste-telMetroscopia y GAD3El PSOE aventaja con claridad al PP pero no alcanza la mayoría y serán necesarios pactos para gobernar. Esa circunstancia dispara el interés por los resultados de las otras fuerzas políticas: Izquierda Unida, UPyD, Podemos y Ciudadanos (Cs). A continuación analizo los sondeos más recientes y llevo a cabo tres simulaciones de resultados para discutir cómo podría quedar configurado el nuevo Parlamento andaluz.

Empezaré revisando las estimaciones de voto. El primer gráfico compara los datos de la encuesta que elaboró el CIS durante el mes de febrero con un promedio de los sondeos del mes de marzo. Según estos datos, durante las últimas semanas Podemos habría perdido apoyos y Cs los habría ganado.

fig 1

(Nota: los datos recopilados de todas las encuestas se los debo a Basilio Moreno.)

El gráfico anterior resume el dilema que afrontamos al juzgar las encuestas disponibles. La encuesta preelectoral del CIS tiene la mayor muestra a nivel provincial y por tanto más precisión teórica al asignar los escaños. Sus ajustes —la llamada cocina— son los preferidos por muchos. Sin embargo, los datos del CIS tienen varias semanas de antigüedad y otras encuestas más recientes podrían capturar mejor la intención de los votantes.

En este artículo trataré de conciliar ambos detalles usando una simulación propia. Pero antes revisaré las estimaciones que hizo el CIS con sus datos de febrero.

Simulaciones a partir del CIS

En el siguiente gráfico muestro los resultados de una primera simulación a partir del voto estimado por el CIS. Hago 10.000 simulaciones para cada provincia, partiendo del voto en cada una y añadiendo varianza con los márgenes de error aproximados. En el gráfico muestro el total que resulta de agregar los votos de cada provincia.

fig 2

Nota: Las columnas en el gráfico indican la mediana de las 10.000 simulaciones. Las cajas representan la dispersión de las simulaciones son diagramas de caja o «Tukey boxplots» e indican la mediana con una línea gruesa, los cuartiles del 25% y el 75% en los extremos de caja, y sus IQR de 1.5 o intervalo del 99,3% con la línea vertical.

El gráfico siguiente muestra la distribución de escaños de la simulación anterior. La distribución resulta de repartir los escaños de cada provincia según los votos. El reparto se realiza según la ley D’Hondt y aplicando una barrera mínima del 3% de los votos, tal y como manda la ley electoral andaluza.

fig 3b

Los resultados coinciden con la previsión de escaños del CIS. Se le asignan 45 escaños al PSOE, 33 al PP, 22 a Podemos, cuatro a IU y cinco a Ciudadanos. UPyD y el Partido Andalucista quedarían fuera del parlamento. En el gráfico tenéis los intervalos estadísticos para cada partido. El PSOE, por ejemplo, se movería entre 44 y 46 escaños con una probabilidad del 68% y entre 42 y 48 con una probabilidad del 99%.

Pero esta estimación tiene un problema: que los sondeos del CIS se hicieron en febrero y según las encuestas más recientes las intenciones de voto han cambiado. A continuación trataré de incorporar esa información a nuestra estimación.

Una estimación híbrida

La siguiente simulación aspira a combinar lo mejor de los datos del CIS —su buena distribución de votos a nivel provincial— con la información más actualizada de los sondeos que vimos al principio. Al combinar datos de diferentes fuentes y diferentes cocinas, estaremos dando, en cierta forma, una estimación de consenso.

Los resultados de esta simulación híbrida se muestran en el gráfico. De nuevo realizo 10.000 simulaciones para cada provincia. Pero ahora el voto estimado será un promedio de los datos de las siete encuestas de marzo que se traslada a cada provincia según la distribución que observó el CIS. Como ya hice en la simulación anterior, añado variabilidad con los márgenes de error aproximados.

fig 4

Como era de esperar, la distribución de votos es similar a la de nuestro primer gráfico. Lo interesante realmente está en el gráfico siguiente, que nos informa de cómo los votos de marzo se traducen en número de escaños.

fig 5c

Empecemos por ver lo que no cambia: el PSOE se mantendría cerca de los 45 escaños, el PP en torno a 31 o 32 e IU sobre cinco, aunque estos dos últimos partidos podrían ganar y perder algún escaño con facilidad.

Las novedades las protagonizan Podemos y Ciudadanos. Si nos fiamos en las encuestas más recientes, Podemos retrocedería hasta los 16 o 17 escaños y Cs crecería hasta lograr 10 diputados.

Cabe recordar que estoy distribuyendo los votos por provincias según lo medido por el CIS en febrero. No es una estimación perfecta pero es una forma de explotar la información más reciente. Lo mejor sería tener una muestra provincial amplia y actualizada pero no lo tenemos. Lo más parecido es la última encuesta de Metroscopia.

Añadiendo incertidumbre

Antes de terminar, quiero subrayar que los márgenes de error no capturan todas las desviaciones entre un sondeo y la realidad de las urnas. Al informar de su «margen de error», una encuesta está indicando el error de su muestreo: el error que se comete por no preguntar a todos los andaluces, sino sólo a unos pocos. Pero el voto definitivo puede desviarse por muchas razones como explicábamos Pablo Simón y yo en este texto: por efecto de los indecisos, por el voto oculto, por respuestas falsas o por cambios de opinión. Hay personas que dicen que votarán en blanco y al final deciden votar por su partido de siempre. El CIS, Metroscopia, My Word y el resto de las firmas de encuestas intentan corregir estos efectos pero es imposible que lo logren del todo.

Para mostrar la importancia de esos efectos haré una última simulación. De nuevo simulo 10.000 casos para cada provincia y añado varianza según los márgenes de error. Pero ahora añado además otra banda de incertidumbre. La banda la defino asumiendo que cada partido puede ganar (o perder) hasta un diez por ciento de sus apoyos más un 1% del total del censo. La intensidad de esta variación la asumo igual en todas las provincias, porque quiero simular perturbaciones comunes.

Los últimos gráficos muestran cómo pueden variar los resultados al asumir esa incertidumbre. La banda que he fijado es totalmente hipotética. No es fruto de ningún cálculo. Su único fin es evaluar cómo la incertidumbre en los votos se traslada a la distribución de escaños.

Aquí se puede ver esa incertidumbre en la estimación de voto.

fig 6

Aquí se puede ver esa incertidumbre aplicada a la distribución de escaños.

fig 7b

Al añadir incertidumbre a la simulación el reparto de escaños más probable apenas cambia, pero el rango de posibles escenarios es mucho más amplio. El PSOE podría moverse fácilmente entre los 43 y los 48 escaños y el PP entre los 30 y los 34. Podemos podría oscilar entre 15 y 18 diputados, Ciudadanos entre ocho y 11 e Izquierda Unida entre cuatro y seis.

La incertidumbre podría propiciar algunos escenarios extremos. El PSOE podría irse hasta los 53 diputados, Podemos podría superar la veintena de escaños e IU caer hasta los dos. Ciudadanos podría dispararse hasta 14 o quedarse en apenas seis. No son los resultados más probables pero entran dentro de los márgenes —no tan amplios— que di en la última simulación.

Entiendo que esta última simulación puede ser decepcionante para quienes queremos saber qué ocurrirá este domingo. Pero quizás captura mejor que las demás lo que sabemos sobre cómo votarán los andaluces este fin de semana.

* * *

Algunos detalles técnicos. En los tres casos hago 10.000 iteraciones para cada provincia. En cada caso parto siempre de una estimación de voto en cada provincia (la original del CIS o un híbrido del CIS y la media de siete sondeos de marzo). Para generar la variabilidad por muestreo uso una distribución normal de desviación estándar tal que replico los márgenes de error del CIS (truncada para evitar negativos). Los márgenes de error los estimo a partir de la muestra de cada provincia y los porcentajes de voto de cada partido a nivel autonómico (es decir, no uso el peor caso). Los resultados de votos totales los calculo agregando los votos de cada provincia ponderados por población. El reparto de escaños lo hago aplicando la regla D’Hondt y la barrera mínima que fija la ley electoral andaluza. En la tercera simulación, genero un ‘shock’ para cada partido, que en cada una de las 10.000 iteraciones puede ganar (o perder) hasta un 1% del censo ± 0,1 veces los votos del partido en la provincia. Dentro de esa banda, los ‘shocks’ se distribuyen uniformemente. Pero el ‘shock’ es igual para todas las provincias en cada una de las 10.000 iteraciones porque quiero simular perturbaciones comunes a todas ellas. 

¿Votarán así los andaluces? Una media ponderada de los sondeos

andalucia 3

Varios diarios publican este domingo los últimos sondeos antes de las elecciones andaluzas. Este gráfico de intención de voto es una media ponderada de las siete encuestas que se han publicado en los últimos días. 

andalucia 3

Varios diarios publican este domingo los últimos sondeos antes de las elecciones andaluzas. Los sondeos llevan la firma de los institutos Deimos, Celeste-tel, Metroscopia y GAD3.

Este gráfico de intención de voto es el fruto de una media de siete encuestas que se han publicado en los últimos días. He ponderado la media según la muestra de cada una de esas encuestas. La línea negra indica el porcentaje de voto que se atribuía a cada partido en la encuesta del CIS. El tono más claro y más oscuro que aparece en cada columna indica el umbral inferior y superior en que se sitúa cada partido. El gráfico es un adelanto de la estimación más detallada que publicaré este lunes en el blog de EL ESPAÑOL.