Así hemos elaborado el especial ‘España en cifras’

espana_cifras_grande_ok

España en cifras es un proyecto de periodismo de datos que hemos realizado para El ESPAÑOL con el objetivo de ayudar a comprender lo que ocurre donde vives a través de los datos. Hemos reunido en esta herramienta los principales indicadores demográficos, sociales y económicos que permiten explicar la realidad que te rodea.

espana_cifras_grande

espana_cifras_grande_ok

España en cifras es un proyecto de periodismo de datos que hemos realizado para El ESPAÑOL con el objetivo de ayudar a comprender lo que ocurre donde vives a través de los datos. Hemos reunido en esta herramienta los principales indicadores demográficos, sociales y económicos que permiten explicar la realidad que te rodea.

Detrás de este especial se esconde un arduo trabajo de recopilación de datos compuesto por más de 75 fuentes a nivel municipal, provincial y autonómico. Estos datos se han limpiado y estructurado para hacerlos más comprensibles a través de diferentes visualizaciones.

¿Qué puedes hacer?

En España en cifras puedes buscar los principales indicadores de tu comunidad autónoma, provincia y municipio. De la metrópoli de Madrid al pueblo toledano de Illán de Vacas, el pueblo con menor número de habitantes según datos del padrón consolidado de 2014. Allí están empadronados dos hombres y una mujer. En marzo de 2015 uno buscaba trabajo.

También puedes realizar comparaciones entre comunidades autónomas, provincias y municipios. Tan sólo tienes que seleccionar “Añade a tu comparación” en cada ficha de la entidad correspondiente. Otra opción es hacerlo desde la pestaña de comparar. Además la herramienta permite realizar comparaciones directamente desde la URL del navegador. ¿Quieres comparar Sevilla con Cádiz? Escribe esto en la barra de tu navegador:

http://espanaencifras.elespanol.com/compara/provincias/sevilla:cadiz

Los artículos y reportajes basados en datos y fuentes abiertas también tienen un lugar destacado en España en cifras. Desde la pestaña de “historias” puedes acceder a los contenidos relacionados con las elecciones, sus municipios y comunidades.

Lo que presentamos aquí es sólo la primera versión de la herramienta España en cifras. Queremos que nos ayudes a mejorarla. Si ves algún error, descubres historias en los datos que creas que merecen ser contadas o quieres hacernos llegar preguntas o sugerir nuevas funcionalidades, ponte en contacto con nosotros en datos@elespanol.com.

Metodología

Se han recogido datos municipales, provinciales y autonómicos. En el caso de los municipios, la desaparición y creación de los mismos, así como el cambio de nombre de algunos de ellos ha complicado en muchos casos la tarea de limpieza.

Los datos electorales presentados pretenden ofrecer un contexto histórico desde que se celebraran los primeros comicios electorales en el año 1979. Se han recopilado datos de los concejales obtenidos en cada legislatura por los partidos. Estas cifras ofrecen la evolución de cada municipio español. Estos datos han sido obtenidos a través de una petición de información enviada al Ministerio del Interior al estar recogidos y publicados únicamente el número de votos obtenidos por cada partido. Además, la herramienta también muestra el nombre de los alcaldes que gobiernan en la actualidad.

A nivel autonómico se ofrece el número de escaños obtenidos por cada partido en cada proceso electoral. Los datos se publican en el Congreso de los Diputados y permiten la descarga en formato reutilizable Excel. Pero debido al amplio número de comicios celebrados desde 1979 y a la cantidad de información, hemos seguido un proceso de automatización para la extracción de los datos. Su posterior limpieza y estructuración también ha conllevadoutilizar un proceso con herramientas de scraping, limpieza y análisis de los datos.

Los nombres de los presidentes autonómicos y el histórico de gobernación de los mismos se ha obtenido a través de un proceso de scraping puesto que esos datos estaban publicados en formato PDF y era difícil obtenerlos.

En cuanto al número de personas llamadas a votar y a los nuevos electores, se han consultado las cifras del Censo Electoral del INE.

Los datos de población se han extraído del Instituto Nacional de Estadística (INE). Para la cifra total de habitantes se han tenido en cuenta los datos de Cifras Oficiales de Población de los Municipios Españoles: Revisión del Padrón Municipal mientras que para el desglose de población por grupos de edad se han usado los datos englobados en la Estadística del Padrón Continuo al no figurar tal distinción en la anterior estadística.

En los datos de deuda pública por comunidades autónomas se ha utilizado como fuente principal el Banco de España. Esta fuente distingue, por un lado, los datos de deuda en relación con el porcentaje que supone del Producto Interior Bruto y, por otro, la deuda pública en números absolutos. Dado que varían según se considere uno u otro, se muestran ambos datos. Asimismo se ha querido mostrar cuál es la cifra de deuda que le corresponde a cada español, cifra que no es publicada por el Banco de España. Es cifra se ha calculado dividiendo la deuda total de cada comunidad entre supoblación.

Para la extracción de datos se ha utilizado la herramienta de scraping Kimono. Las tecnologías empleadas para el análisis y la limpieza de los datos han sido Excel y Open Refine. También se han utilizado diferentes herramientas para extraer tablas atrapadas en documentos PDF como Tabula.

Proyecto realizado para EL ESPAÑOL por el siguiente equipo:
Coordinación: Antonio Delgado (Datadista / @adelgado)
Tratamiento de datos y contenido: Patricia López (@lopezg_patricia)
Diseño de producto: Álvaro Ortiz (@furilo)
Programación y ‘backend’: Fernando Blat (@ferblape)
Visualizaciones: Beatriz Martínez (@maritrinez)