# Creación de un mapa de Zaragoza a partir de un archivo cvs

## Origen de los datos

En primer lugar, lo primero es establecer el origen de los datos que vamos a utilizar y definirlos en una variable. Por un lado, se genera la variable de los datos a través del enlace de datos abiertos del Ayuntamiento de Zaragoza que provee un archivo CSV con un registro de los accidentes viales.


### Configuración de pandas y creación de variables

Para la elaboración del mapa de Zaragoza es necesario crear distintas varibles e importar librerías. En primer lugar, se definen las variables `url_zrgz` y `geo_zrgz`:

In [6]:
url_zrg = 'http://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv'

Además, se definen las coordenadas geográficas de Zaragoza para, posteriormente, ser capaces de visualizar las dos variables juntas: los accidentes y el lugar en el que se produjeron.

In [2]:
geo_zrgz = [41.649693,-0.887712]

## Instalación de librerías: Folium y Pandas

En el caso de que no lo tengamos instalado, con `pip install folium` se instala la librería, sin olvidarnos de colocar el signo ! para señalar que se trata de un comando de la terminal.

In [3]:
!pip install folium

Collecting folium
  Downloading folium-0.12.1.post1-py2.py3-none-any.whl (95 kB)
[K     |████████████████████████████████| 95 kB 1.7 MB/s eta 0:00:011
Collecting branca>=0.3.0
  Downloading branca-0.4.2-py3-none-any.whl (24 kB)
Installing collected packages: branca, folium
Successfully installed branca-0.4.2 folium-0.12.1.post1


Una vez se ha realizado esto, se importan las liberías "folium" y "panda" y se redefine esta última como `pd`:

In [4]:
import pandas as pd 
import folium 

## Creación de mapa

Tras definir las variables e importar las librerías, se crea el mapa con la ubicación que se quiera, en este caso, la ubicación es la ciudad de Zaragoza. Esto se hace con `folium.Map()` y, entre los paréntesis, se indica la variable que contiene las coordenadas geográficas. 

In [6]:
mapa_zrgz = folium.Map(location=geo_zrgz)

Se muestra el mapa. Esta librería usa [OpenStreetMap](https://www.openstreetmap.org/#map=6/40.007/-2.488) para generar los mapas, un proyecto de código abierto alternativo a los de las grandes corporaciones (como Google o Apple), en el que son organizaciones y usuarios los que se encargan de su mantenimiento y actualización.

In [7]:
mapa_zrgz

Tras esto, se crea a partir de un archivo csv un DataFrame de Pandas llamado `df_zrgz`. Se indica que el delimitador de los datos en el CSV del Ayuntamiento de Zaragoza no es una coma (,), sino un punto y coma `(;)`. De esta forma, se evita que se visualicen y se analicen mal los datos al no separarse cada uno correctamente. A continuación, se muestra lo realizado:

In [13]:
df_zrgz = pd.read_csv(url_zrg,delimiter=';')
df_zrgz

Unnamed: 0,id,year,type,accidentType,firstAddress,secondAddress,geometry,reason,area,creationDate,daniosMateriales,falloMecanico,estadoPavimento,tipoEstadoPavimento,estadoAtmosfera,tipoEstadoAtmosfera,afectado,vehiculo
0,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,"COSTA, JOAQUIN","PERAL, ISAAC","-0.8818527060979306,41.649027473051156",PERDIDA del control por FALTA de ATENCIÓN,,2014-10-09T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
1,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,CADENA(MARQUES DE LA),,"-0.8645810716721081,41.661585829868585","DISTANCIA DE SEGURIDAD, no mantener",2560.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
2,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,"GOMEZ AVELLANEDA, G.","CASTRO, R. (POETA)","-0.887776415002892,41.666992622958105",PERDIDA del control por FALTA de ATENCIÓN,2598.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
3,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS FRONTOLATERAL,,MONZON,"GARCIA CONDOY, H.","-0.8825260453930127,41.62957498750602","CEDA EL PASO, no respetar prioridad de paso",2555.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
4,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,RIOJA,"NAVARRA, AVENIDA DE","-0.908314757720389,41.6562121210704",PERDIDA del control por VELOCIDAD INADECUADA,2554.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
5,https://www.zaragoza.es/sede/servicio/transpor...,2014,OTRAS,,MUEL,,"-0.8691088511672924,41.65949772773082",Caída de ocupante en Transporte Público,2578.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
6,https://www.zaragoza.es/sede/servicio/transpor...,2014,ATROPELLO,,"PIGNATELLI, RAMON VIA",,"-0.8880337913721866,41.633353667694024",PEATÓN cruza calz SIN PREFER. fuera de paso,2606.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
7,https://www.zaragoza.es/sede/servicio/transpor...,2014,CAIDA SOBRE CALZADA,,"ALIERTA, AV. CESAREO","AULA, LUIS","-0.8708838775078237,41.6390382112928",INVADIR otro carril en el mismo sentido de cir...,2583.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
8,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS. MARCHA ATRÁS,,"CERBUNA, PEDRO",,"-0.8970649943808023,41.64083344974765",PERDIDA del control por FALTA de ATENCIÓN,2556.0,2014-10-24T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
9,https://www.zaragoza.es/sede/servicio/transpor...,2013,COLISIÓN LATERAL,,ASALTO,"COCCI, JORGE","-0.8718525605769747,41.64904657717317",INVADIR otro carril en el mismo sentido de cir...,4657.0,2013-12-20T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...


Se muestra el nombre de las columnas de la tabla para familiarizarse con los datos presentes en esta base de datos, de cara a una futura visualización y análisis de los mismos:

In [14]:
df_zrgz.columns

Index(['id', 'year', 'type', 'accidentType', 'firstAddress', 'secondAddress',
       'geometry', 'reason', 'area', 'creationDate', 'daniosMateriales',
       'falloMecanico', 'estadoPavimento', 'tipoEstadoPavimento',
       'estadoAtmosfera', 'tipoEstadoAtmosfera', 'afectado', 'vehiculo'],
      dtype='object')

Se muestra la información de la tabla como objeto de Pandas:

Expone información sobre el DataFrame entre la que incluye el índice (RangeIndex) con el número de entradas, el número de columnas que hay (Data Columns), el nombre de las columnas (Colum), la cantidad de datos nulos que posee la tabla (Non-Null Count), el tipo de variable de las columnas (Dtype) y el tamaño (memory usage).

In [15]:
df_zrgz.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 50 entries, 0 to 49
Data columns (total 18 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   id                   50 non-null     object 
 1   year                 50 non-null     int64  
 2   type                 50 non-null     object 
 3   accidentType         0 non-null      float64
 4   firstAddress         50 non-null     object 
 5   secondAddress        24 non-null     object 
 6   geometry             50 non-null     object 
 7   reason               50 non-null     object 
 8   area                 44 non-null     float64
 9   creationDate         50 non-null     object 
 10  daniosMateriales     50 non-null     bool   
 11  falloMecanico        50 non-null     bool   
 12  estadoPavimento      50 non-null     object 
 13  tipoEstadoPavimento  0 non-null      float64
 14  estadoAtmosfera      50 non-null     object 
 15  tipoEstadoAtmosfera  0 non-null      float

Por ejemplo, se observan las razones que se han asignado a cada accidente: primero sin filtrar (es decir, viendo la tabla al completo con repetidos), y luego filtrando para que solo aparezca una vez cada razón. De estad forma se ven más claros los motivos que han sido asignados a los accidentes. 

Si se escribe entre corchetes `[]` el nombre de una o varias de las columnas (en este caso 'reason'), solo se muestran esos valores.

In [16]:
df_zrgz['reason']

0             PERDIDA del control por FALTA de ATENCIÓN
1                   DISTANCIA DE SEGURIDAD, no mantener
2             PERDIDA del control por FALTA de ATENCIÓN
3           CEDA EL PASO, no respetar prioridad de paso
4          PERDIDA del control por VELOCIDAD INADECUADA
5               Caída de ocupante en Transporte Público
6           PEATÓN cruza calz SIN PREFER. fuera de paso
7     INVADIR otro carril en el mismo sentido de cir...
8             PERDIDA del control por FALTA de ATENCIÓN
9     INVADIR otro carril en el mismo sentido de cir...
10              Caída de ocupante en Transporte Público
11            PERDIDA del control por FALTA de ATENCIÓN
12            PERDIDA del control por FALTA de ATENCIÓN
13            PERDIDA del control por FALTA de ATENCIÓN
14    PEATÓN cruza calz SIN PREFER. en PASO CON semá...
15            PERDIDA del control por FALTA de ATENCIÓN
16                  DISTANCIA DE SEGURIDAD, no mantener
17            PERDIDA del control por FALTA de A

Se puede utilizar la función `.unique()` para saber cuáles son los tipos de valores de cada caso, es decir, se eliminan las repeticiones e, interpretandose los datos, se entiende que son las "categorías" que pueden darse, respectivamente, como valores en la columna "reason", "geometry" y "type" que especificamos usando `[]`.

A continuación, se muestran los valores que no se repiten de la columna "reason".

In [17]:
df_zrgz['reason'].unique()

array(['PERDIDA del control por FALTA de ATENCIÓN',
       'DISTANCIA DE SEGURIDAD, no mantener',
       'CEDA EL PASO, no respetar prioridad de paso',
       'PERDIDA del control por VELOCIDAD INADECUADA',
       'Caída de ocupante en Transporte Público',
       'PEATÓN cruza calz SIN PREFER. fuera de paso',
       'INVADIR otro carril en el mismo sentido de circulación',
       'PEATÓN cruza calz SIN PREFER. en PASO CON semáforo',
       'PUERTA abierta incorrectamente', 'MARCHA ATRÁS',
       'SEMÁFORO, no respetar prioridad de paso', 'OTRAS CAUSAS',
       'PEATÓN cruza calz CON PREFER. en PASO  CON semáforo',
       'PEATÓN cruza calz CON PREFER. en PASO  SIN semáforo'],
      dtype=object)

Se muestran los valores que no se repiten de la columna "type":

In [18]:
df_zrgz['type'].unique()

array(['SALIDA CALZADA', 'COLISIÓN ALCANCE', 'COLIS FRONTOLATERAL',
       'OTRAS', 'ATROPELLO', 'CAIDA SOBRE CALZADA', 'COLIS. MARCHA ATRÁS',
       'COLISIÓN LATERAL'], dtype=object)

Y, finalmente, se muestra la columna "geometry":

In [19]:
df_zrgz['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
5      -0.8691088511672924,41.65949772773082
6     -0.8880337913721866,41.633353667694024
7       -0.8708838775078237,41.6390382112928
8      -0.8970649943808023,41.64083344974765
9      -0.8718525605769747,41.64904657717317
10     -0.8964627561577849,41.64322365075108
11     -0.8778095796207178,41.68753087470739
12    -0.8812157329722801,41.661646612715046
13      -0.8762000299022707,41.6454384961757
14     -0.9089013552408617,41.65543768899759
15     -0.9004729973337304,41.65180346604993
16     -0.8917562993466011,41.65233828238132
17      -0.888856043735591,41.65040494617356
18    -0.8629911318784169,41.645335650478316
19    -0.8870207060655807,41.609992514227066
20     -0.8636325074780108,41.63379905763323
21     -0.8760724207544668,41.63275556609146
22     -0.