# Práctica en el mapa de Zaragoza

En este cuaderno utilizaremos las librerías de **Pandas** y **Folium** para leer una API que importaremos como archivo **.csv** sobre accidentes de tráfico en Zaragoza registrados por su Ayuntamiento. El objetivo es que **Python** lea esos datos para poder explorarlos con distintas funciones para representar la ubicación de los accidentes en un mapa. Lo primero lo podremos hacer con Pandas, una librería de código abierto de Python que proporciona herramientas de análisis y manipulación de datos. Lo segundo lo haremos con Folium, una librería de creación de mapas web interactivos con Python. 

La relación entre ambas librerías para el manejo y representación de este conjunto de datos es que una de sus catergorías es `calle` y sus datos son coordenadas geográficas. De ahí que supongan datos propicios para la combinación de ambas herramientas. 

## Definición de variables

Definimos las variables con las que vamos a trabajar para que Python conozca los datos. Una variable es aquello que puedo crear como tal al nombrarlo. Su sintaxis es `=`, por ejemplo, *x = x*. Vamos a definir como variables los elementos básicos de nuestro trabajo, a saber, los datos (para trabajarlos con Pandas) y las coordenadas geográficas de Zaragoza, escenario de los datos a representar (para hacerlo con Folium).

In [1]:
url_zrgz = "https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv"
geo_zrgz = [41.646693,-0.887712]

Al definir estas variables no es necesario volver a copiar el link cuando queramos vincular los datos, sino que lo haremos con la referencia que hemos creado, en este caso `url_zrgz` y `geo_zrgz`. Como vemos, la sintaxis de la primera es  con `""` y de la segunda con `[]`, puesto que se trata de un intervalo con ambos valores incluidos.

No es imprescindible definir estas referencias en primer lugar, pero sí forma parte de los pasos previos al inicio propiamente dicho del proceso exploratorio de los datos. Podemos resumir estos pasos previos en tres:
1. Definición de variables 
2. Preparación de librerías
3. Creación del dataframe

Procedemos al segundo punto:

## Preparación de librerías

La preparación de las librerías es la condición de posibilidad de nuestro trabajo. Conlleva dos pasos:
- Instalación (`!pip install` *librería*)
- Importación (`import` *librería* o `import` *librería* `as` *su abreviación*)

### Instalación

Solo es necesaria la instalación de la librería que vayamos a utilizar a contunuación. Por lo que no es imprescindible instalar ahora Pandas. Podríamos hacerlo cuando el documento lo requiriese. Pero vamos a tenerla ya preparada. Tampoco es imprescindible instalar librerías si ya lo hemos hecho en otros cuadernos y Python las ha utilizado con anterioridad. Por ello no necesito instalarme Pandas de nuevo. La importación siempre es necesaria. 

Instalo Folium: `!pip install folium`

In [61]:
!pip install folium 



### Importación 

Ahora ya tengo las dos librerías instaladas en Python. Pero eso no significa que las tenga ya aquí en este documento para trabajar con ellas. Para ello necesito importarlas. Por eso, a diferencia que la instalación, que puede realizarse una sola vez, la importación es obligatoria en cada notebook en que quiera usarse. Con el comando `import` importo ambas librerías.La de pandas lo hago con su abreviación típica *pd*.

In [62]:
import pandas as pd
import folium 

Una vez tenemos las variables definidas (los datos y las coordenadas) y las librerías preparadas es hora de empezar a trabajar con los datos. Necesito abrirlos desde este documento creando un *dataframe* que los abra. Pero antes (aunque puedo no hacerlo así) abro el mapa para tener presente el espacio en el que quiero proceder a la representación de los datos.

## Mapa Zaragoza

De la librería Folium quiero que Python me muestre un mapa: el folio *map* con las cooredenadas anteriormente señaladas con la referencia `geo_zrgz`.  Definiremos esta acción **mapa_zrgz** con `=`.

In [7]:
mapa_zrgz = folium.Map(location=geo_zrgz)

Hemos definido la variable, que a continuación decimos que la ejecute.

In [8]:
mapa_zrgz

Ahora que tenemos este mapa necesitamos que Python lea los datos que queremos que en él represente. La librería que puede hacer esto es **Pandas**. Auqnue tengamos la librería instalada e importada, aún no vemos en este archivo los datos. Tenemos que pedir a Python que con la librería Pandas nos lea los datos. Para ello creamos un dataframe (*df_zrgz*) que será el resultado (esto lo indicamos con *=*) de leer el documento al que lo hemos vinculado. Esto último lo hace con la función `.read_`*tipodocumento*. En este caso vamos a indicarle que es un documento **.csv** aunque los datos no lo sean, porque de esta forma le decimos a Python que cada dato está delimitado por `;`. Al indicarle eso también haremos que el propio Python genere un archivo csv (como podemos comprobar en la interfaz de nuestro servidor) a partir de los datos de la api. 

Una vez indicado el tipo de archivo, corresponde en la sintaxis introducir la referencia del mismo. En nuestro caso es la base de datos, pero no es necesario copiar su link ya que anteriormente la hemos definido como variable, por lo que le damos la referencia (*url_zrgz*). Por último, le especificamos que introduzca los datos delimitados: `pd.read_csv(url_zrgz,delimiter=';')`.

**NOTA**: Un delimitador es una secuencia de uno o más caracteres para especificar el límite entre regiones separadas e independientes en flujos de datos. Así logramos que presente los datos, que no son tabulados, en categorías.

In [12]:
df_zrgz = pd.read_csv(url_zrgz,delimiter=';')

In [13]:
df_zrgz

Unnamed: 0,id,year,type,accidentType,firstAddress,secondAddress,geometry,reason,area,creationDate,daniosMateriales,falloMecanico,estadoPavimento,tipoEstadoPavimento,estadoAtmosfera,tipoEstadoAtmosfera,afectado,vehiculo
0,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,"COSTA, JOAQUIN","PERAL, ISAAC","-0.8818527060979306,41.649027473051156",PERDIDA del control por FALTA de ATENCIÓN,,2014-10-09T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
1,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,CADENA(MARQUES DE LA),,"-0.8645810716721081,41.661585829868585","DISTANCIA DE SEGURIDAD, no mantener",2560.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
2,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,"GOMEZ AVELLANEDA, G.","CASTRO, R. (POETA)","-0.887776415002892,41.666992622958105",PERDIDA del control por FALTA de ATENCIÓN,2598.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
3,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS FRONTOLATERAL,,MONZON,"GARCIA CONDOY, H.","-0.8825260453930127,41.62957498750602","CEDA EL PASO, no respetar prioridad de paso",2555.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
4,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,RIOJA,"NAVARRA, AVENIDA DE","-0.908314757720389,41.6562121210704",PERDIDA del control por VELOCIDAD INADECUADA,2554.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
5,https://www.zaragoza.es/sede/servicio/transpor...,2014,OTRAS,,MUEL,,"-0.8691088511672924,41.65949772773082",Caída de ocupante en Transporte Público,2578.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
6,https://www.zaragoza.es/sede/servicio/transpor...,2014,ATROPELLO,,"PIGNATELLI, RAMON VIA",,"-0.8880337913721866,41.633353667694024",PEATÓN cruza calz SIN PREFER. fuera de paso,2606.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
7,https://www.zaragoza.es/sede/servicio/transpor...,2014,CAIDA SOBRE CALZADA,,"ALIERTA, AV. CESAREO","AULA, LUIS","-0.8708838775078237,41.6390382112928",INVADIR otro carril en el mismo sentido de cir...,2583.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
8,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS. MARCHA ATRÁS,,"CERBUNA, PEDRO",,"-0.8970649943808023,41.64083344974765",PERDIDA del control por FALTA de ATENCIÓN,2556.0,2014-10-24T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
9,https://www.zaragoza.es/sede/servicio/transpor...,2013,COLISIÓN LATERAL,,ASALTO,"COCCI, JORGE","-0.8718525605769747,41.64904657717317",INVADIR otro carril en el mismo sentido de cir...,4657.0,2013-12-20T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...


Una vez tenemos el dataframe creado lo exploramos con distintas funciones. En primer lugar, `.info` para saber qué contiene el dataframe.

In [14]:
df_zrgz.info

<bound method DataFrame.info of                                                    id  year  \
0   https://www.zaragoza.es/sede/servicio/transpor...  2014   
1   https://www.zaragoza.es/sede/servicio/transpor...  2014   
2   https://www.zaragoza.es/sede/servicio/transpor...  2014   
3   https://www.zaragoza.es/sede/servicio/transpor...  2014   
4   https://www.zaragoza.es/sede/servicio/transpor...  2014   
5   https://www.zaragoza.es/sede/servicio/transpor...  2014   
6   https://www.zaragoza.es/sede/servicio/transpor...  2014   
7   https://www.zaragoza.es/sede/servicio/transpor...  2014   
8   https://www.zaragoza.es/sede/servicio/transpor...  2014   
9   https://www.zaragoza.es/sede/servicio/transpor...  2013   
10  https://www.zaragoza.es/sede/servicio/transpor...  2013   
11  https://www.zaragoza.es/sede/servicio/transpor...  2013   
12  https://www.zaragoza.es/sede/servicio/transpor...  2013   
13  https://www.zaragoza.es/sede/servicio/transpor...  2013   
14  https://www.zaragoz

Esto es un resumen de los datos de la tabla. `.info` nos informa sobre el conjunto de datos que estamos tratando. Estos son sobre la naturaleza de una serie de accidentes de tráfico: año, motivo, dirección... A continuación queremos conocer la razón de cada accidente de tráfico, para lo que ponemos `['reason]` detrás de *df_zrgz*. No lleva `.` porque no se trata de una función sobre los datos sino una forma de visualización diferente en la que nosotros pedimos el dato que queremos que nos muestre. La sisntaxis es `df['categoría']`, en este caso el motivo del accidente.

In [19]:
df_zrgz['reason']

0             PERDIDA del control por FALTA de ATENCIÓN
1                   DISTANCIA DE SEGURIDAD, no mantener
2             PERDIDA del control por FALTA de ATENCIÓN
3           CEDA EL PASO, no respetar prioridad de paso
4          PERDIDA del control por VELOCIDAD INADECUADA
5               Caída de ocupante en Transporte Público
6           PEATÓN cruza calz SIN PREFER. fuera de paso
7     INVADIR otro carril en el mismo sentido de cir...
8             PERDIDA del control por FALTA de ATENCIÓN
9     INVADIR otro carril en el mismo sentido de cir...
10              Caída de ocupante en Transporte Público
11            PERDIDA del control por FALTA de ATENCIÓN
12            PERDIDA del control por FALTA de ATENCIÓN
13            PERDIDA del control por FALTA de ATENCIÓN
14    PEATÓN cruza calz SIN PREFER. en PASO CON semá...
15            PERDIDA del control por FALTA de ATENCIÓN
16                  DISTANCIA DE SEGURIDAD, no mantener
17            PERDIDA del control por FALTA de A

Si queremos ver el conjunto de los datos (en este caso razones de los dintintos accidentes) sin una distinción por filas o el número de cada uno de los accidentes recogidos en la base de datos utilizamos la función `unique()`.

In [20]:
df_zrgz['reason'].unique()

array(['PERDIDA del control por FALTA de ATENCIÓN',
       'DISTANCIA DE SEGURIDAD, no mantener',
       'CEDA EL PASO, no respetar prioridad de paso',
       'PERDIDA del control por VELOCIDAD INADECUADA',
       'Caída de ocupante en Transporte Público',
       'PEATÓN cruza calz SIN PREFER. fuera de paso',
       'INVADIR otro carril en el mismo sentido de circulación',
       'PEATÓN cruza calz SIN PREFER. en PASO CON semáforo',
       'PUERTA abierta incorrectamente', 'MARCHA ATRÁS',
       'SEMÁFORO, no respetar prioridad de paso', 'OTRAS CAUSAS',
       'PEATÓN cruza calz CON PREFER. en PASO  CON semáforo',
       'PEATÓN cruza calz CON PREFER. en PASO  SIN semáforo'],
      dtype=object)

La función `.unique()` sirve para delimitar los valores únicos en columnas. Es decir, las razones (categoría *reason* que elegimos visualizar antes) de los motivos del accidente que no se repiten en este conjunto de datos. Con la sintaxis descrita anteriormente cambiamos la categoría que queremos que nos muestre para acercarnos más a los datos e ir extrayendo toda su información.

In [21]:
df_zrgz['type'].unique()

array(['SALIDA CALZADA', 'COLISIÓN ALCANCE', 'COLIS FRONTOLATERAL',
       'OTRAS', 'ATROPELLO', 'CAIDA SOBRE CALZADA', 'COLIS. MARCHA ATRÁS',
       'COLISIÓN LATERAL'], dtype=object)

Tras explorar los datos los representamos en el mapa.

## Representación en el mapa

Pedimos que nos enseñe los datos de las coordenadas geográficas a representar en el mapa que son los que se encuentran en la categoría *geometry*.

In [22]:
df_zrgz['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
5      -0.8691088511672924,41.65949772773082
6     -0.8880337913721866,41.633353667694024
7       -0.8708838775078237,41.6390382112928
8      -0.8970649943808023,41.64083344974765
9      -0.8718525605769747,41.64904657717317
10     -0.8964627561577849,41.64322365075108
11     -0.8778095796207178,41.68753087470739
12    -0.8812157329722801,41.661646612715046
13      -0.8762000299022707,41.6454384961757
14     -0.9089013552408617,41.65543768899759
15     -0.9004729973337304,41.65180346604993
16     -0.8917562993466011,41.65233828238132
17      -0.888856043735591,41.65040494617356
18    -0.8629911318784169,41.645335650478316
19    -0.8870207060655807,41.609992514227066
20     -0.8636325074780108,41.63379905763323
21     -0.8760724207544668,41.63275556609146
22     -0.

Le pedimos que nos enseñe el nombre de dichas coordenadas para tenerlas a mano para poder escribir su nombre en el mapa. La categoría es *firstAddress*. Añado la función `.unique()` para acortar su extensión. Esto no podía realizarlo en la función anterior porque trabajaba con números y era necesaria la distinción por líneas de cada una de las coordenadas para poder diferenciarlas. Pero ahora puedo prescindir de ello ya que trabajo con texto. 

In [33]:
df_zrgz['firstAddress'].unique()

array(['COSTA, JOAQUIN', 'CADENA(MARQUES DE LA)', 'GOMEZ AVELLANEDA, G.',
       'MONZON', 'RIOJA', 'MUEL', 'PIGNATELLI, RAMON VIA',
       'ALIERTA, AV. CESAREO', 'CERBUNA, PEDRO', 'ASALTO',
       'ARAGON (CORONA DE)', 'FRAGUA, LA', 'PIRINEOS, AV. DE LOS',
       'TORRES, CAMINO DE LAS', 'ITALIA', 'AGUSTIN, PASEO MARIA',
       'CASPE, AV.COMPROMISO', 'MURANO, ISLA DE AV.',
       'HISPANIDAD, RONDA DE', 'ZARAGOZA LA VIEJA',
       'ASIN Y PALACIOS, MIG.', 'ZAMBRANO, M. (POETA)',
       'ALBA (DUQUE DE),PASEO', 'HISPANIDAD, VIA', 'PARAISO, PL.BASILIO',
       'SAGASTA, PASEO DE', 'CABALDOS, CAMINO DE',
       'GOYA,FCO.(PINTOR) AV.', 'CONSTITUCION, PASEO', 'TORRE',
       'ECHEGARAY Y CABALLERO', 'ALMOZARA, AV. DE LA',
       'OLIVAN, ALEJANDRO', 'ARRUPE, PADRE', 'RUIZ PICASSO, PABLO',
       'CAMPOAMOR, CLARA', 'CASCAJO, CN. DEL  SJN', 'EDISON, TOMAS A',
       'CUELLAR, PASEO DE', 'PLAN, IBON DE', 'FANLO',
       'AZNAR,ADOLFO(CINEASTA', 'ALLENDE, SALVADOR AV.'], dtype=object)

Creamos un mapa (m) a partir del anterior al que añadimos marcardores con las coordenadas y nombres de las calles correspondientes utilizando la función `folium.Marquer`.

La sintaxis de la función `folium.map`es la siguiente: 
- (`location=`*coordenadas de referencia*`,`
- `zoom_start=`*número pertinente al caso*`,`
- `tiles=`*estilo de mapa que queramos*). 

En este caso he borrado la opción 'tiles' opción ya que tras probar distintos estilos como 'Stamen Terrain' o 'Stamen Toner' he preferido el que viene definido en Folium y por tanto no necesita ser especificado.  

La sintaxis de `folium.Marker`, que forma parte de nuestro nuevo mapa "m", es la siguiente:
- `([*coordenadas],`
- `popup=`*nombre de la calle*`,`
- `tooltip=`*lo que quiera que se vea al posicionar el cursor en el marcador*`)` Puedo definir esta variable con antelación para dejarla preestablecida si quiero poner en todas las localizaciones la misma etiqueta; 'accidente' en este caso. La sintaxis entonces es para todos los marcadores `tooltip=tooltip)`
- `.add_to(m)` para añadir los cambios al nuevo mapa resultante. 

Lo he llevado a cabo con las dos primeras coordenadas como ejemplo pero el proceso es el mismo para todas. 

In [95]:
m=folium.Map(location=geo_zrgz,zoom_start=13)
tooltip='Accidente'
folium.Marker([-0.8818527060979306,41.649027473051156], popup='Calle Joaquín Costa', tooltip=tooltip).add_to(m)
folium.Marker([-0.8645810716721081,41.661585829868585], popup='Calle Marqués de la Cadena', tooltip=tooltip).add_to(m)
m

Vemos así los puntos de los accidentes marcados en el mapa. 