¿Acertaron las encuestas del 27S? Un repaso a sus cifras y a nuestra predicción

g2

Las elecciones catalanas se presentaban complicadas para los encuestadores. Eran unos comicios excepcionales y es difícil hacer estádistica de lo excepcional. Concurrían nuevos partidos, la participación se presumía histórica y el sentido del voto era para muchos inédito: un plebiscito. Pero las encuestas hicieron un buen trabajo. Aquí explico por qué.

También en EL ESPAÑOL:

Nota. Que un modelo probabilístico se demuestre bien calibrado es en esencia otra forma de precisión. Pero para los propósitos de este artículo he creído que la distinción entre precisión y calibración era útil.

Radiografía del resultado: así votó Cataluña en su noche más decisiva

comarcas_indepen

Artur Mas convocó las elecciones del 27S con la intención de impulsar el proceso soberanista. Pero menos de la mitad de los votantes ha respaldado a las dos listas que defendían abiertamente la independencia: Junts pel Sí y la CUP. Aquí la mejor radiografía de la cita electoral: datos, análisis y contexto. 

Las elecciones catalanas se presentaban complicadas para los encuestadores. Eran unos comicios excepcionales y es difícil hacer estadística de lo excepcional. Concurrían nuevos partidos, la participación se presumía histórica y el sentido del voto era para muchos inédito: un plebiscito. Pero las encuestas hicieron un buen trabajo. Aquí explico por qué.

1. El promedio de sondeos funcionó.

El gráfico compara 20 sondeos con los resultados de las elecciones del domingo. Los sondeos son los de Sigma Dos, GAPS, GESOP, NC Report, Invymark, IBES, Feedback, CIS, Metroscopia, DYM, GAD3, Celeste Tel y My Word.

g1

El promedio de encuestas anticipó la imagen general que dejaron las urnas. JxSí, el PP y CUP fueron bien estimados. Tambien el PSC. La mayor desviación se dió con Ciudadanos y Catalunya Sí que es Pot (CSP). El primero había sido infraestimado y el segundo sobreestimado, justo al revés de lo que pasó en las municipales de mayo.

2. Nuestro modelo fue razonablemente preciso.

Basándome en los sondeos, publiqué dos días antes del 27S un modelo de predicción para las elecciones. El modelo estimaba cuántos diputados lograría cada partido y con qué probabilidad.

A continuación evalúo que tal lo hizo ese modelo. El gráfico compara los diputados de cada partido con las predicciones probabilísticas del modelo.

g2

(Las áreas de color son histogramas y representan la probabilidad que tiene cada partido de lograr cierto número de escaños.)

La precisión del modelo fue notable. Acertó el partido ganador, acertó quién sería segundo y el orden de todos los partidos excepto el PSC y CSP, que se intercambiaron. La predicción más probable se desvió menos de dos escaños para JxSí, PSC, PP, CUP y Unió. Las mayores desviaciones se dieron con Cs y CSP. Pero desde el principio sus resultados eran los más inciertos: sus distribuciones de probabilidad eran las más anchas.

El modelo predijo también los resultados del independentismo. Anticipó que JxSí no tendría mayoría absoluta y que la suma con CUP lograría mayoría de escaños pero no de votos. Sus predicciones mediana para los escaños de JxSí y la CUP casi coinciden con los resultados reales.

Captura de pantalla 2015-09-30 a las 23.48.26

También las predicciones de votos:

g4

Estoy también satisfecho con las predicciones en cada provincia. En Barcelona la precisión fue similar a la general. En Tarragona la predicción de más probabilidad acertó para JxSí, PSC, CUP y Unió. En Lleida, para PSC, PP, CUP, Unió y JxSí. En Girona, para todos los partidos. (Gráficos de Barcelona, Tarragona, Lleida y Girona.)

3. Un reloj parado.

Mi primer objetivo con el modelo es que fuese fiable. Sus predicciones no son audaces ni finísimas: son cautas. Por eso había muchos resultados posibles en el segundo gráfico. No es así por capricho. Es así porque observar las encuestas de los últimos años me sugiere que ésa es la precisión que podemos esperar.

Estos eran los intervalos del 50% de probabilidad que el modelo asignaba a cada partido:

  • JxSí: [59, 67]
  • Cs: [17, 23]
  • CSP: [12, 18]
  • PSC: [11, 17]
  • PP: [11, 15]
  • CUP: [ 6, 10]
  • Unió: [ 0, 3]

Son intervalos amplios e incluso así la mitad de las veces la realidad debía acabar fuera de ellos. Por eso las desviaciones con Ciutadans o CSP no son una sorpresa. Al final, de los siete partidos cinco cayeron dentro de los intervalos. Y aunque no puedo saberlo todavía, creo que la incertidumbre del modelo está bien calibrada.

¿Pero qué significa «bien calibrada»?

Mi modelo respeta el primer principio que enuncia Nate Silver para hacer estimaciones electorales: «Un buen modelo debe ser probabilístico, no determinista». La mayoría de modelos de predicción tienden al exceso de confianza y mi propósito es no caer en ese error. Por eso mi modelo no da predicciones muy concretas si no puede —y generalmente no puede— sino predicciones con distintas probabilidades.

Para calibrar un modelo probabilístico hay que comprobar que sus predicciones aciertan con la probabilidad prevista. Por ejemplo, si mi modelo dice que el partido X tiene un 60% de probabilidades de lograr escaños, quiero que eso suceda un 60% de las veces. Si sucede solo el 10% de las veces el modelo está mal. Pero también está mal si sucede el 95% del tiempo. Ese modelo está mal calibrado.

Podéis pensar en las predicciones meteorológicas. No espero que el hombre del tiempo me diga con certeza si lloverá el sábado. Pero si me dice que la probabilidad de lluvia es del 20%, lo que espero es que acierte cuatro de cada cinco veces.

En resumen, al evaluar la bondad de un modelo probabilístico podemos hablar de dos cosas: de su precisión y de su calibración. Un modelo es muy preciso si dice exactamente qué va a ocurrir. Esos modelos son geniales, pero difíciles de encontrar para fenómenos complejos. Por eso las elecciones se predicen con modelos probabilísticos. Y esos modelos quiero que estén bien calibrados: si me dicen que un suceso tiene una probabilidad del 66%, deberán acertar dos de cada tres veces.

4. Conclusión.

Tras las elecciones el modelo de predicción sale reforzado. Sus limitaciones siguen ahí —y de ellas hablaré otro día— pero sus predicciones para el 27S fueron bastante precisas.

Si el modelo falló fue más bien por acertar demasiado. Quizás el modelo está ligeramente mal calibrado y fue demasiado conservador. O lo que es más probable: quizás tuvo algo de suerte. Si la razón es una u otra sólo lo sabremos dentro de muchas tiradas, cuando podamos distinguir la estructura del azar.

_____________

También en EL ESPAÑOL:

Nota. Que un modelo probabilístico se demuestre bien calibrado es en esencia otra forma de precisión. Pero para los propósitos de este artículo he creído que la distinción entre precisión y calibración era útil.

Así votarán los catalanes según el promedio de los últimos sondeos

votoEl próximo domingo se celebran unas elecciones catalanas de especial trascendencia por el carácter plebiscitario que les dan las fuerzas independentistas. A continuación analizo lo que nos dicen las últimas encuestas sobre esos comicios.

El próximo domingo se celebran unas elecciones catalanas de especial trascendencia por el carácter plebiscitario que les dan las fuerzas independentistas. A continuación analizo lo que nos dicen las últimas encuestas sobre esos comicios.

1. La estimación de votos

En el primer gráfico muestro las estimaciones de voto según 20 sondeos publicados desde julio. Además incluyo un promedio de los sondeos ponderado según el tamaño de muestra y la fecha de cada uno.

voto(Nota: la metodología es similar a la que he usado para las elecciones generales.)

Según las encuestas, la candidatura donde se integran ERC y Convergència, Junts pel Sí, lograría alrededor del 40% de los votos. Detrás vendrían Ciutadans (15%), Catalunya Sí que es Pot (12%) —la coalición formada por ICV, EUiA, Equo y Podemos—, el PSC (11%), el PP (10%), la CUP (7%) y Unió (3%).

2. La estimación de escaños

En las últimas semanas también se han publicado varias estimaciones de escaños que recojo en el siguiente gráfico.

esc

Según los sondeos, Junts pel Sí no lograría la mayoría absoluta, que está fijada en 68 escaños. Pero sacaría alrededor de 63 y tendría una amplísima ventaja sobre el resto de partidos. Ciutadans sería la segunda fuerza con 20 escaños, seguida de CSP (15), PSC (14), PP (13), CUP (8) y Unió (0-2).

Estas estimaciones de escaños, sin embargo, deben tomarse con cautela porque pequeñas variaciones en los votos pueden modificarlas mucho.

3. La suma de JxSí y la CUP en votos y en escaños

Acabamos de ver que la suma de JxSí y la CUP no supera el 50% de votos en las encuestas. Pero los dos partidos que proponen ir hacía la independencia sí sumarían una mayoría de escaños en el Parlament de Cataluña.

mayorias

En el gráfico he incluido la suma de fuerzas de JxSí y la CUP en los sondeos. La encuesta de GAPS es la única que da una mayoría de votos. En cambio todas las encuestas excepto dos de NC Report les dan una mayoría de escaños.

4. La evolución del voto

Para acabar, en este último gráfico represento la evolución de las estimaciones de voto desde principios de julio hasta hoy.

serie

Durante la campaña se observa una subida de JxSí y de la CUP, aunque muy ligera (alrededor de un 1% cada uno). La celebración de la Diada y el resto de eventos en estas dos semanas parecen haber reforzado a los partidarios del independentismo.

Del resto, el único movimiento lo protagoniza Catalunya sí que es Pot, la coalición de Podemos e ICV, que no sólo no habría conseguido potenciar su marca durante la campaña sino que habría retrocedido ligeramente.

En resumen, las últimas encuestas apuntan a que JxSí ganará las elecciones aunque no logrará la mayoría absoluta. Sí la alcanzaría con el apoyo de la CUP, aunque no es seguro que la organización de izquierdas vaya a investir a Artur Mas como president. Las encuestas dicen también que Ciutadans será la segunda fuerza, seguido de Catalunya sí que es Pot. Sin embargo, la relativa novedad de ambos partidos hace que sus previsiones se rodeen de más incertidumbre que las del resto.

También en EL ESPAÑOL:

Así son los catalanes que votarán el 27S. Una radiografía en cinco gráficos.

Así votarían los españoles: suben PP y PSOE pero el bipartidismo sigue en mínimos históricos

uno

Retroceden los partidos emergentes y avanzan los tradicionales. No obstante, el avance de PP y PSOE es sólo relativo. El bipartidismo sigue en mínimos históricos: la suma de los dos grandes partidos nunca ha bajado del 60% de votos en unas elecciones generales y las encuestas presagian ahora un 52%.

Quedan tres meses para las generales y en Cataluña arranca ya una precampaña de facto. Desde ahora y durante el otoño van a sucederse los acontecimientos: habrá elecciones en Grecia y luego en Cataluña, conoceremos datos económicos y casos de corrupción. Todo eso en el escenario electoral más convulso de las últimas décadas. Pero, ¿cuál es el punto de partida? ¿Cómo votarían los ciudadanos si estuvieran llamados hoy mismo a las urnas?

A continuación tenéis el promedio de encuestas que estoy haciendo en EL ESPAÑOL. El primer gráfico muestra el promedio y las 15 encuestas más recientes, incluidas varias de esta semana. El resultado es un escenario con cuatro partidos escalonados: PP (28%), PSOE (25%), Podemos (17%) y Ciudadanos (12%).

uno

(Observaréis que existen grandes diferencias entre encuestas: ésa es la razón por la que hacemos un promedio de consenso. El promedio es una media de 75 encuestas ponderadas por fecha y muestra cuyos detalles podéis encontrar en la metodología.)

El gráfico anterior es la foto fija del momento. Pero podemos observar también como ha ido evolucionando el apoyo de cada partido desde 2014. Aunque el ruido de las encuestas oculta las tendencias, éstas emergen nítidas en el promedio.

dos

En el gráfico vemos que el PP mantiene una línea ascendente y que gana tres o cuatro puntos desde abril. También el PSOE mejora, quizás más lentamente.

En cambio, Podemos retrocede desde el inicio de 2015. En diciembre llegó a ser la segunda fuerza, pero ha perdido simpatizantes y cae de aquel 25% de voto estimado al 17%. El partido de Pablo Iglesias pierde un tercio de sus apoyos, aunque se mantiene tercero con holgura. Detrás viene Ciudadanos, que también retrocede desde su máximo de abril.

Ésas son las tendencias actuales: retroceden los partidos emergentes y avanzan los tradicionales. No obstante, el avance de PP y PSOE es sólo relativo. El bipartidismo sigue en mínimos históricos: la suma de los dos grandes partidos nunca ha bajado del 60% de votos en unas elecciones generales y desde 1993 superó siempre el 70%. Las encuestas presagian ahora un 52% de voto para la suma de PP y PSOE y eso haría de las elecciones de diciembre las menos bipartidistas de la democracia.

tres

¿Pero a qué se debe el avance del PP y el PSOE en los últimos meses? Se han propuesto al menos tres explicaciones diferentes, aunque no excluyentes.

Para algunos, el avance tiene que ver con la economía: desde hace unos meses los ciudadanos somos menos pesimistas con la situación del país, lo que estaría beneficiando al PP, dado que es el partido en el gobierno, pero curiosamente también al PSOE, como alternativa cauta, en cuanto que es conocida.

Una segunda explicación sería la novedad de Podemos y Ciudadanos. Estos partidos habrían disfrutado de una luna de miel y por un tiempo no sufrieron la oposición de otros partidos ni fueron sometidos al total escrutinio de los medios. Pasado ese periodo, su imagen habría empeorado y por eso pierden votantes.

La tercera explicación es que la proximidad de las elecciones haya recuperado votos para el PP y el PSOE. Cuando las urnas se veían lejos, algunos encuestados habrían declarado un voto más expresivo o de protesta que real. Ahora, al acercarse las elecciones, esos votantes podrían haber ido recuperando sus simpatías partidistas tradicionales.

Estas tres hipótesis presagian un avance del PP y el PSOE en los próximos meses: las elecciones estarán cada vez más cerca, Podemos y Ciudadanos no volverán a ser nuevos y la economía es probable que mejore. Sin embargo, las intenciones de los votantes se moverán por otros motivos y con sucesos sobre los que nada sabemos como el resultado en Cataluña o las campañas electorales. Además los votos estarán muy repartidos y el parlamento muy fragmentado, dos circunstancias que al acercarse las elecciones podrían inducir movimientos de voto útil.

Desde EL ESPAÑOL iré actualizando el promedio de encuestas, desde ahora y durante el otoño, para tratar de alumbrar esas incógnitas.


Metodología: por qué y cómo promediar encuestas. La razón para promediar las encuestas se intuye viendo su gran variabilidad. Sondeos de fechas similares se desvían unos de otros y esas desviaciones apenas reflejan cambios de los votantes. Así se observa en el gráfico de barras (el primero del artículo): en los puntos no vemos tendencias sino una nube ruidosa. El ruido lo provocan los errores de muestreo y los diferentes ajustes que hace cada encuestador (la llamada cocina). Es decir, los cambios de una encuesta a la siguiente se deben más al azar y al criterio de sus técnicos que a cambios de los encuestados. Por eso no podemos sacar grandes conclusiones de una encuesta.

La alternativa es promediar encuestas. De esa forma reducimos el error de muestreo y consensuamos los criterios de los encuestadores. El resultado es más parsimonioso y libre de ruido, y capturará mejor la corriente de profundidad: los cambios lentos en la intención de voto de los encuestados.

Detalles del promedio. Nuestro promedio es una media ponderada según la muestra y la fecha de cada sondeo. Además aplico dos ajustes según la empresa encuestadora: doy menos peso a las firmas sin datos históricos y corrijo lo que se conoce como house effects. De los cuatro factores que afectan al peso de las encuestas, la fecha es el más importante. El resto tienen efectos menores y sirven sobre todo para saber que esos factores no son determinantes.

El peso de una encuesta en el promedio depende sobre todo de su fecha. Un ejemplo: para calcular el promedio del 1 de julio uso la información de todas las encuestas de semanas anteriores y posteriores, pero dando más peso a las encuestas más cercanas a ese día. El peso de cada encuesta decae exponencialmente con los días, con una constante de tiempo de 28 días, de forma que una encuesta pierde la mitad de su peso a los 20 días.

También tengo en cuenta la muestra de cada encuesta, de forma que las que hicieron más entrevistas reciben más peso. Este efecto es pequeño porque los datos nos dicen que la muestra no es un gran predictor de la precisión de una encuesta.

Pensando en asignar peso a cada encuesta he analizado también la precisión histórica de cada empresa encuestadora. Los resultados que he obtenido son poco concluyentes y por lo tanto no doy pesos individuales a cada encuestadora. El único ajuste que introduzco consiste en dar un 18% más de peso a las encuestas de firmas de las que tengo al menos cinco encuestas en el histórico, porque mi análisis sugiere que esas firmas han sido mejores en sus predicciones. Para estimar esto he analizado la precisión de diferentes encuestadoras en las elecciones generales de 2011, las europeas de 2014 y una parte de las municipales y autonómicas de 2015. Este peso extra que doy a algunas encuestadoras tiene un efecto pequeño en el promedio.

Por último, también corrijo las encuestas de lo que se conoce como house effect -la tendencia de cada encuestadora a desviarse del promedio de encuestas de forma sistemática durante una elección-. Estas desviaciones son absolutamente legítimas y pueden deberse, por ejemplo, al método de recogida de datos del encuestador y a los criterios técnicos con que tratan a los votantes indecisos. Al corregir estos efectos evito que el orden en que se suceden las encuestas afecte demasiado a nuestro promedio. Es decir, intento que los movimientos del promedio no se deban a los votantes y no al encuestador.

¿Aguirre o Carmena? Una predicción de sus votos y sus alianzas

concejalesPartiendo del promedio de votos de las encuestas, he hecho 10.000 simulaciones en las que he tenido en cuenta los márgenes de error y cierta incertidumbre. El PP rondaría 22 concejales. Ahora Madrid sería el segundo partido.

Los madrileños votarán este domingo para elegir a su alcalde. Según las encuestas, el PP será la primera fuerza pero no alcanzará la mayoría absoluta. Esa circunstancia dispara el interés por el resto de fuerzas políticas: especialmente por Ahora Madrid, Ciudadanos y el PSOE.

Hay dos posibilidades. La primera es que varios partidos sumen la mayoría de concelajes y lleguen a un acuerdo para elegir al alcalde entre sus candidatos. Es casi seguro que el PP y Ciudadanos tendrán esa opción y también la combinación de Ahora Madrid, PSOE y Ciudadanos. La segunda posibilidad es que no haya acuerdos de ese tipo. En ese caso, la alcadesa será la candidata más votada.

¿Pero cómo de probable es cada una de estas alternativas? A continuación describo una simulación de las elecciones al Ayuntamiento de Madrid. Los resultados nos servirán para analizar las posibilidades de cada candidato.

Lo que dicen los sondeos

Empecemos revisando las estimaciones de voto. El primer gráfico muestra un promedio de los sondeos que han publicado los institutos SigmaDos, NC Report, MyWord y Metroscopia en el último mes.

encuestas

El gráfico refleja la gran dispersión de las encuestas. Esa dispersión se debe al menos a tres factores: los errores de muestreo, los cambios temporales y las diferencias en los ajustes que hace cada encuestador: lo que conocemos como la cocina.

De los tres factores, el menos problemático es el muestreo porque se reduce al agregar las encuestas. Pero el voto definitivo aún puede desviarse por muchas otras razones: por el voto oculto, por la abstención o por decisiones de última hora. El CIS, Metroscopia, My Word y el resto de las firmas intentan corregir estos efectos pero es imposible corregirlos del todo.

Al agregar varias encuestas, conseguimos dos cosas: reducimos el error de muestreo y hacemos entre todas una cocina de consenso. Eso mejora la predicción pero la incertidumbre no desaparece.

Es posible, por ejemplo, que todas las encuestas se equivoquen en la misma dirección como ocurrió en Reino Unido hace dos semanas. Quizás todas infravaloran el voto oculto o exageran la participación. A esa incógnita hay que añadir el factor tiempo: los votantes pueden cambiar de opinión de aquí al domingo. Por estas y otras razones, es importante asumir cierta incertidumbre al predecir.

Añadiendo incertidumbre

A continuación vamos a usar la media de encuestas para predecir cuántos concejales logrará cada partido. Pero lo haremos asumiendo que esos datos son imprecisos. ¿Pero en qué medida? ¿Cómo puede uno calcular la magnitud de su ignorancia? Una posibilidad sería usar datos históricos. Pero en el inédito contexto actual no está claro que eso sea de mucha utilidad.

Lo que haremos es asumir una incertidumbre hipotética. Partiendo del promedio de votos de las encuestas, haremos 10.000 simulaciones añadiendo varianza según los márgenes de error y cierta incertidumbre. Asumiremos que en cada simulación los votos de cada partido varían con una cierta distribución normal. (Los detalles están al final de este texto y la distribución de votos que resulta puede verse en este gráfico.)

Los resultados de esa simulación sobre el número de concejales se muestran a continuación. El gráfico ilustra la representación que lograría cada uno de los partidos.

concejales

El primer partido sería el PP con alrededor de 22 concejales. Sus resultados pueden oscilar fácilmente entre los 20 y los 23 concejales e incluso alejarse bastante de esa horquilla. Lo que se antoja muy difícil es que Esperanza Aguirre alcance la mayoría absoluta, que está fijada en 29 concejales.

Ahora Madrid tiene una alta probabilidad de convertirse en el segundo partido. Lograría alrededor de 14 representes. El PSOE sería tercero con 11 concejales pero podría ganar dos más con facilidad. Ciudadanos sería cuarto y oscilaría alrededor de los diez ediles.

Es muy probable que Izquierda Unida se quede sin representación. Nuestros cálculos le dan solo un 15% de probabilidades de conseguirlo. (Tiene que superar la barrera del 5% de votos para lograrlo). Las posibilidades de UPyD son casi nulas de acuerdo con las encuestas.

Las posibles mayorías

Según los resultados anteriores, ningún partido logrará la mayoría absoluta. Eso abre la puerta a pactos para nombrar al próximo alcalde de Madrid. ¿Pero qué coaliciones tienen más probabilidades de sumar una mayoría suficiente? Al contar con un modelo de simulación, podemos calcularlo.

En el último gráfico se muestra el número de concejales que suman diferentes fuerzas: el PP con Ciudadanos y Ahora Madrid con PSOE, Ciudadanos e IU. El propósito es estimar hasta qué punto es probable que logren los 29 representantes que necesitan para nombrar al alcalde.

mayorías

El modelo dice que es muy probable que la suma del PP y Ciudadanos superará los 29 concejales. Si llegan a un acuerdo podrían nombrar alcalde a uno de sus candidatos, previsiblemente a Esperanza Aguirre.

Pero es aún más probable que Ahora Madrid, PSOE y Ciudadanos traspasen ese umbral: en un 99% de nuestras simulaciones, la suma de sus concejales iguala o supera los 29 necesarios.

Los acuerdos de Ahora Madrid sin Ciudadanos son menos probables. Sólo un 12% de las simulaciones sitúan a Ahora Madrid, PSOE e IU con un número suficiente para nombrar alcalde a uno de sus candidatos. Sin IU esas posibilidades caen hasta el 8%.

Si ninguno de estos pacto prospera, el alcalde sería el candidato más votado.

Permitidme acabar con una nota de precaución. Es importante recordar que las probabilidades que he calculado se asientan sobre la base de una incertidumbre hipotética. Si las encuestas fallasen por un margen más amplio —por ejemplo si los madrileños cambiasen sus votos en respuesta a las encuestas de estos días—, los resultados del próximo domingo serían distintos. Creo que eso es improbable pero lo único seguro es que es posible: en las urnas no hay ningún voto todavía.


Algunos detalles técnicos. En las 10.000 simulaciones parto de una media de las seis encuestas del último mes. Para generar la variabilidad por muestreo uso una distribución normal de desviación estándar tal que replico los márgenes de error considerando la muestra total (truncada para evitar votos negativos). Los márgenes de error los estimo a partir del porcentaje de voto promedio de cada partido, no usando el peor caso.

A esa variabilidad añado otra que representa la incertidumbre asumida. Esa incertidumbre corresponde con una distribución normal de media cero y desviación estándar 0,25 + 0,15 votos. La distribución de votos que resulta de añadir esta variabilidad por muestreo e incertidumbre puede verse en este gráfico.

En cada una de las 10.000 iteraciones, a partir de los votos calculo el reparto de concejales aplicando la regla D’Hondt y la barrera mínima del 5%.

¿Votarán así los habitantes de Madrid y Barcelona? Una media de los sondeos

mad 2

Este lunes publicaré aquí mi predicción de los resultados electorales en las ciudades de Madrid y Barcelona. Unas horas antes y a modo de aperitivo, publico aquí dos gráficos con una media ponderada de los sondeos que se han publicado durante el último mes. 

Este lunes publicaré aquí mi predicción de los resultados electorales en las ciudades de Madrid y Barcelona. Unas horas antes y a modo de aperitivo, publico dos gráficos con una media de los sondeos que se han publicado durante el último mes.

Los seis sondeos de Madrid llevan la firma de los institutos demoscópicos Sigma Dos (dos), NC Report, Metroscopia (dos) y MyWord. Los cinco de Barcelona los han elaborado Sigma Dos, Metroscopia, GAD3, Feedback y GESOP.

La mayoría de los sondeos auguran un triunfo de Esperanza Aguirre sin mayoría absoluta. Aunque las cifras de Metroscopia indican un auge repentino de Manuela Carmena, aspirante de la coalición izquierdista Ahora Madrid. Pero otro sondeo publicado también ayer por Sigma Dos es más cercano a los de semanas anteriores.

mad 2

Los resultados son aún más inciertos en Barcelona. La mayoría de los sondeos augura un triunfo por la mínima de Xavier Trias. Pero el CIS y Metroscopia predicen una victoria de la activista Ada Colau, que lidera la coalición Barcelona en Comú.

bcn

Actualización. 11.45am. He actualizado el gráfico de Madrid con un sondeo nuevo de Sigma Dos. Además, en una versión anterior la media de los sondeos estaba ponderada con la muestra de cada encuesta. Al actualizar los gráficos, he eliminado la ponderación. Los resultados apenas cambian.

¿Con quién podrá pactar Susana Díaz? Sus opciones en dos gráficos

gráfico 2

El lunes presenté tres estimaciones para analizar cómo puede quedar configurado el nuevo Parlamento andaluz. Ahora vuelvo sobre aquellos resultados para mostrar mejor la distribución de los escaños y hacer los cálculos de las posibles mayorías que pueden salir de la cita electoral.

En este artículo del lunes presenté tres estimaciones para analizar cómo puede quedar configurado el nuevo Parlamento andaluz. Cada una estaba basada en 10.000 simulaciones que llevé a cabo sobre las cifras del barómetro del CIS y de varios sondeos electorales que se habían publicado a lo largo del mes de marzo. A continuación vuelvo sobre aquellos resultados para mostrar mejor la distribución de los escaños y hacer los cálculos de las posibles mayorías que pueden salir de la cita electoral.

Usaré los resultados del tercer modelo que presenté en el artículo del lunes. El modelo agrega información de siete sondeos y del barómetro del CIS pero incluye un grado de incertidumbre para intentar acotar las desviaciones entre los sondeos y la realidad de las urnas. Los detalles están en el texto del lunes. Basta con recordar que la incertidumbre que he fijado es hipotética: su finalidad es evaluar cómo la variabilidad en los votos (ésta que se ve en el gráfico) se trasladará a la distribución de escaños del Parlamento.

El primer gráfico que presentó aquí muestra los resultados de las 10.000 simulaciones con ese modelo:

llaneras1

El resultado más probable del PSOE son 45 escaños. Pero no sería nada extraño que su resultado oscilara entre 43 y 48 e incluso que se alejara bastante de esa horquilla. Lo que se antoja muy difícil a la luz de las encuestas es que los socialistas alcancen la mayoría absoluta, que en Andalucía está fijada en 55 escaños.

Un modelo con simulaciones nos puede ayudar también a calcular las posibles mayorías que se podrían formar después de la cita electoral. En el siguiente gráfico tenéis el número de escaños que suma el PSOE con una tercera fuerza: Podemos, Ciudadanos e Izquierda Unida. El propósito es estimar hasta qué punto es probable que logren los 55 escaños.

gráfico 2

Los resultados son dispares para cada una de las posibles coaliciones. El modelo dice que es casi seguro que la suma del PSOE y Podemos supere los 55 escaños que otorga la mayoría de la cámara. También parece probable que la suma del PSOE y Ciudadanos traspase ese umbral: en un 71% de nuestras simulaciones, la suma de sus escaños supera o iguala los 55 escaños. Menos probable parece la opción de reeditar la mayoría actual: sólo un 20% de las simulaciones sitúan al PSOE y a IU con un número de diputados que les permita gobernar en coalición. Una mayoría de ambos partidos no es imposible: la gente puede votar como quiera. Pero sólo ocurrirá si las encuestas fallan por un margen amplio.
Todos los detalles de las simulaciones se pueden consultar en este artículo.

Así votarán los andaluces: el cálculo de escaños más completo

fig 7b

Los andaluces elegirán este domingo su Parlamento autonómico. El PSOE aventaja con claridad al PP pero no alcanza la mayoría y serán necesarios pactos para gobernar. A continuación analizo los sondeos más recientes y llevo a cabo tres simulaciones de resultados para discutir cómo podría quedar configurado el nuevo Parlamento andaluz.

Los andaluces elegirán este domingo su Parlamento autonómico. En las últimas horas se han publicado sondeos de los institutos DeimosCeleste-telMetroscopia y GAD3El PSOE aventaja con claridad al PP pero no alcanza la mayoría y serán necesarios pactos para gobernar. Esa circunstancia dispara el interés por los resultados de las otras fuerzas políticas: Izquierda Unida, UPyD, Podemos y Ciudadanos (Cs). A continuación analizo los sondeos más recientes y llevo a cabo tres simulaciones de resultados para discutir cómo podría quedar configurado el nuevo Parlamento andaluz.

Empezaré revisando las estimaciones de voto. El primer gráfico compara los datos de la encuesta que elaboró el CIS durante el mes de febrero con un promedio de los sondeos del mes de marzo. Según estos datos, durante las últimas semanas Podemos habría perdido apoyos y Cs los habría ganado.

fig 1

(Nota: los datos recopilados de todas las encuestas se los debo a Basilio Moreno.)

El gráfico anterior resume el dilema que afrontamos al juzgar las encuestas disponibles. La encuesta preelectoral del CIS tiene la mayor muestra a nivel provincial y por tanto más precisión teórica al asignar los escaños. Sus ajustes —la llamada cocina— son los preferidos por muchos. Sin embargo, los datos del CIS tienen varias semanas de antigüedad y otras encuestas más recientes podrían capturar mejor la intención de los votantes.

En este artículo trataré de conciliar ambos detalles usando una simulación propia. Pero antes revisaré las estimaciones que hizo el CIS con sus datos de febrero.

Simulaciones a partir del CIS

En el siguiente gráfico muestro los resultados de una primera simulación a partir del voto estimado por el CIS. Hago 10.000 simulaciones para cada provincia, partiendo del voto en cada una y añadiendo varianza con los márgenes de error aproximados. En el gráfico muestro el total que resulta de agregar los votos de cada provincia.

fig 2

Nota: Las columnas en el gráfico indican la mediana de las 10.000 simulaciones. Las cajas representan la dispersión de las simulaciones son diagramas de caja o «Tukey boxplots» e indican la mediana con una línea gruesa, los cuartiles del 25% y el 75% en los extremos de caja, y sus IQR de 1.5 o intervalo del 99,3% con la línea vertical.

El gráfico siguiente muestra la distribución de escaños de la simulación anterior. La distribución resulta de repartir los escaños de cada provincia según los votos. El reparto se realiza según la ley D’Hondt y aplicando una barrera mínima del 3% de los votos, tal y como manda la ley electoral andaluza.

fig 3b

Los resultados coinciden con la previsión de escaños del CIS. Se le asignan 45 escaños al PSOE, 33 al PP, 22 a Podemos, cuatro a IU y cinco a Ciudadanos. UPyD y el Partido Andalucista quedarían fuera del parlamento. En el gráfico tenéis los intervalos estadísticos para cada partido. El PSOE, por ejemplo, se movería entre 44 y 46 escaños con una probabilidad del 68% y entre 42 y 48 con una probabilidad del 99%.

Pero esta estimación tiene un problema: que los sondeos del CIS se hicieron en febrero y según las encuestas más recientes las intenciones de voto han cambiado. A continuación trataré de incorporar esa información a nuestra estimación.

Una estimación híbrida

La siguiente simulación aspira a combinar lo mejor de los datos del CIS —su buena distribución de votos a nivel provincial— con la información más actualizada de los sondeos que vimos al principio. Al combinar datos de diferentes fuentes y diferentes cocinas, estaremos dando, en cierta forma, una estimación de consenso.

Los resultados de esta simulación híbrida se muestran en el gráfico. De nuevo realizo 10.000 simulaciones para cada provincia. Pero ahora el voto estimado será un promedio de los datos de las siete encuestas de marzo que se traslada a cada provincia según la distribución que observó el CIS. Como ya hice en la simulación anterior, añado variabilidad con los márgenes de error aproximados.

fig 4

Como era de esperar, la distribución de votos es similar a la de nuestro primer gráfico. Lo interesante realmente está en el gráfico siguiente, que nos informa de cómo los votos de marzo se traducen en número de escaños.

fig 5c

Empecemos por ver lo que no cambia: el PSOE se mantendría cerca de los 45 escaños, el PP en torno a 31 o 32 e IU sobre cinco, aunque estos dos últimos partidos podrían ganar y perder algún escaño con facilidad.

Las novedades las protagonizan Podemos y Ciudadanos. Si nos fiamos en las encuestas más recientes, Podemos retrocedería hasta los 16 o 17 escaños y Cs crecería hasta lograr 10 diputados.

Cabe recordar que estoy distribuyendo los votos por provincias según lo medido por el CIS en febrero. No es una estimación perfecta pero es una forma de explotar la información más reciente. Lo mejor sería tener una muestra provincial amplia y actualizada pero no lo tenemos. Lo más parecido es la última encuesta de Metroscopia.

Añadiendo incertidumbre

Antes de terminar, quiero subrayar que los márgenes de error no capturan todas las desviaciones entre un sondeo y la realidad de las urnas. Al informar de su «margen de error», una encuesta está indicando el error de su muestreo: el error que se comete por no preguntar a todos los andaluces, sino sólo a unos pocos. Pero el voto definitivo puede desviarse por muchas razones como explicábamos Pablo Simón y yo en este texto: por efecto de los indecisos, por el voto oculto, por respuestas falsas o por cambios de opinión. Hay personas que dicen que votarán en blanco y al final deciden votar por su partido de siempre. El CIS, Metroscopia, My Word y el resto de las firmas de encuestas intentan corregir estos efectos pero es imposible que lo logren del todo.

Para mostrar la importancia de esos efectos haré una última simulación. De nuevo simulo 10.000 casos para cada provincia y añado varianza según los márgenes de error. Pero ahora añado además otra banda de incertidumbre. La banda la defino asumiendo que cada partido puede ganar (o perder) hasta un diez por ciento de sus apoyos más un 1% del total del censo. La intensidad de esta variación la asumo igual en todas las provincias, porque quiero simular perturbaciones comunes.

Los últimos gráficos muestran cómo pueden variar los resultados al asumir esa incertidumbre. La banda que he fijado es totalmente hipotética. No es fruto de ningún cálculo. Su único fin es evaluar cómo la incertidumbre en los votos se traslada a la distribución de escaños.

Aquí se puede ver esa incertidumbre en la estimación de voto.

fig 6

Aquí se puede ver esa incertidumbre aplicada a la distribución de escaños.

fig 7b

Al añadir incertidumbre a la simulación el reparto de escaños más probable apenas cambia, pero el rango de posibles escenarios es mucho más amplio. El PSOE podría moverse fácilmente entre los 43 y los 48 escaños y el PP entre los 30 y los 34. Podemos podría oscilar entre 15 y 18 diputados, Ciudadanos entre ocho y 11 e Izquierda Unida entre cuatro y seis.

La incertidumbre podría propiciar algunos escenarios extremos. El PSOE podría irse hasta los 53 diputados, Podemos podría superar la veintena de escaños e IU caer hasta los dos. Ciudadanos podría dispararse hasta 14 o quedarse en apenas seis. No son los resultados más probables pero entran dentro de los márgenes —no tan amplios— que di en la última simulación.

Entiendo que esta última simulación puede ser decepcionante para quienes queremos saber qué ocurrirá este domingo. Pero quizás captura mejor que las demás lo que sabemos sobre cómo votarán los andaluces este fin de semana.

* * *

Algunos detalles técnicos. En los tres casos hago 10.000 iteraciones para cada provincia. En cada caso parto siempre de una estimación de voto en cada provincia (la original del CIS o un híbrido del CIS y la media de siete sondeos de marzo). Para generar la variabilidad por muestreo uso una distribución normal de desviación estándar tal que replico los márgenes de error del CIS (truncada para evitar negativos). Los márgenes de error los estimo a partir de la muestra de cada provincia y los porcentajes de voto de cada partido a nivel autonómico (es decir, no uso el peor caso). Los resultados de votos totales los calculo agregando los votos de cada provincia ponderados por población. El reparto de escaños lo hago aplicando la regla D’Hondt y la barrera mínima que fija la ley electoral andaluza. En la tercera simulación, genero un ‘shock’ para cada partido, que en cada una de las 10.000 iteraciones puede ganar (o perder) hasta un 1% del censo ± 0,1 veces los votos del partido en la provincia. Dentro de esa banda, los ‘shocks’ se distribuyen uniformemente. Pero el ‘shock’ es igual para todas las provincias en cada una de las 10.000 iteraciones porque quiero simular perturbaciones comunes a todas ellas. 

¿Votarán así los andaluces? Una media ponderada de los sondeos

andalucia 3

Varios diarios publican este domingo los últimos sondeos antes de las elecciones andaluzas. Este gráfico de intención de voto es una media ponderada de las siete encuestas que se han publicado en los últimos días. 

andalucia 3

Varios diarios publican este domingo los últimos sondeos antes de las elecciones andaluzas. Los sondeos llevan la firma de los institutos Deimos, Celeste-tel, Metroscopia y GAD3.

Este gráfico de intención de voto es el fruto de una media de siete encuestas que se han publicado en los últimos días. He ponderado la media según la muestra de cada una de esas encuestas. La línea negra indica el porcentaje de voto que se atribuía a cada partido en la encuesta del CIS. El tono más claro y más oscuro que aparece en cada columna indica el umbral inferior y superior en que se sitúa cada partido. El gráfico es un adelanto de la estimación más detallada que publicaré este lunes en el blog de EL ESPAÑOL.