Práctica 4

María Cayuela

En esta Práctica 4, he realizado un cuaderno de Python en el que he usado la API pública de la sección de Datos Abiertos del Ayuntamiento de Arganda del Rey. Concretamente, he trabajado con las diversas bases de datos que mantiene el municipio sobre la concentración de ozono en la ciudad.

Parte 1: media anual 2006-2016

Por un lado, he usado la base de datos que contiene la media anual de ozono por metro cúbico (m3) de los años 2006 a 2016, ambos incluidos. Una vez importado tanto la librería Pandas como la base de datos a través de la API, he creado el dataframe a partir de ellos. No obstante, he tenido que limpiar y recodificar los valores de la variable de la concentración de ozono, ya que no eran numéricos, sino que era una cadena de texto. Para hacer el gráfico correctamente, he pasado los valores a tipo numérico.

Parte 2: comparación de la concentración de ozono en Arganda por mes y año

Por otro lado, el Ayuntamiento de Arganda del Rey tiene otras tres bases de datos publicadas, que he usado a través de su API, con los datos de la concentración de ozono por metro cúbico en la ciudad. Concretamente, corresponde a un valor mensual por cada mes de los años 2014, 2015 y 2016.

De la misma manera, he tenido que recodificar los valores de la variable de la concentración de ozono para transformarlos en numéricos y que nos sirviesen para realizar la visualización de los datos en el gráfico. No obstante, también he tenido que recodificar los valores de la variable Meses, porque tampoco se encontraban de forma numérica (por ejemplo, mm), sino mm|aaaa. Una vez hecha esta limpieza de los datos, he procedido a realizar la visualización con los datos mensuales por año de la concentración de ozono en Arganda del Rey.

Este notebook se puede consultar en formato html e ipynb. También está disponible el conjunto de datos como archivo CSV.

Como reflexión final, cabe destacar que los datos abiertos de las administraciones públicas en España, consultados a través del portal de Datos Abiertos, no siempre mantienen un mismo formato o estándares para que sea fácil su utilización o reutilización por parte de ciudadanos y ciudadanas como nosotros. Criterios diferentes para codificar los JSON, falta de valores numéricos donde correspondían, dificultad en trabajarlos a través de Panda… En mi opinión, el concepto de «datos abiertos» por parte de las administraciones públicas no implica únicamente que los datos se publiquen: también, que puedan ser fácilmente usados y explotados por los ciudadanos, sin trabas que dificulten este proceso.