# Análisis de datos con las librerías 'pandas' y 'folium'

### Antes de empezar, creamos variables para la localización de Zaragoza y usarla al ejecutar las funciones de folium

In [3]:
url_zgz='https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv'
geo_zgz=[41.649693,-0.887712]


### En primer lugar, instalamos la librería porque el paquete (folium) no se encuentra dentro de las librerías de las que dispone Jupyterhub

In [7]:
!pip install folium



### Importamos las dos librerías. A pandas en concreto la llamamos pd para referenciarla así y no tener que escribir el nombre completo cada vez

In [9]:
import pandas as pd
import folium


### Generamos una variable que guarda los datos de la función de folium (el mapa con las coordinadas asignadas a la variable geo_zgz)

In [13]:
mapa_zgz = folium.Map(location=geo_zgz)

### Llamamos a la variable que contenía los datos de la función de folium. Esto nos mostrará un mapa con la información de nuestra localización

In [14]:
mapa_zgz

### Llamamos al URL que contiene el archivo CSV con la función de pandas read_csv y después analizamos con nano qué delimitadores tiene este archuivo en concreto y comprobamos que es ;, de manera que utilizamos este signo, especificando que ese es el delimitador

In [16]:
df_zgz = pd.read_csv(url_zgz,delimiter= ';')

### Del dataframe df_zgz averiguamos el nombre de sus columnas

In [18]:
 df_zgz.columns

Index(['id', 'year', 'type', 'accidentType', 'firstAddress', 'secondAddress',
       'geometry', 'reason', 'area', 'creationDate', 'daniosMateriales',
       'falloMecanico', 'estadoPavimento', 'tipoEstadoPavimento',
       'estadoAtmosfera', 'tipoEstadoAtmosfera', 'afectado', 'vehiculo'],
      dtype='object')

### Indicamos qué columna queremos que se visualice, en este caso, la columna 'reason'

In [19]:
df_zgz['reason']

0             PERDIDA del control por FALTA de ATENCIÓN
1                   DISTANCIA DE SEGURIDAD, no mantener
2             PERDIDA del control por FALTA de ATENCIÓN
3           CEDA EL PASO, no respetar prioridad de paso
4          PERDIDA del control por VELOCIDAD INADECUADA
5               Caída de ocupante en Transporte Público
6           PEATÓN cruza calz SIN PREFER. fuera de paso
7     INVADIR otro carril en el mismo sentido de cir...
8             PERDIDA del control por FALTA de ATENCIÓN
9     INVADIR otro carril en el mismo sentido de cir...
10              Caída de ocupante en Transporte Público
11            PERDIDA del control por FALTA de ATENCIÓN
12            PERDIDA del control por FALTA de ATENCIÓN
13            PERDIDA del control por FALTA de ATENCIÓN
14    PEATÓN cruza calz SIN PREFER. en PASO CON semá...
15            PERDIDA del control por FALTA de ATENCIÓN
16                  DISTANCIA DE SEGURIDAD, no mantener
17            PERDIDA del control por FALTA de A

### Utilizamos la función unique para saber los valores distintos que existen en la columna reason

In [20]:
df_zgz['reason'].unique()


array(['PERDIDA del control por FALTA de ATENCIÓN',
       'DISTANCIA DE SEGURIDAD, no mantener',
       'CEDA EL PASO, no respetar prioridad de paso',
       'PERDIDA del control por VELOCIDAD INADECUADA',
       'Caída de ocupante en Transporte Público',
       'PEATÓN cruza calz SIN PREFER. fuera de paso',
       'INVADIR otro carril en el mismo sentido de circulación',
       'PEATÓN cruza calz SIN PREFER. en PASO CON semáforo',
       'PUERTA abierta incorrectamente', 'MARCHA ATRÁS',
       'SEMÁFORO, no respetar prioridad de paso', 'OTRAS CAUSAS',
       'PEATÓN cruza calz CON PREFER. en PASO  CON semáforo',
       'PEATÓN cruza calz CON PREFER. en PASO  SIN semáforo'],
      dtype=object)

### Utilizamos la función unique para saber los valores distintos que existen en la columna type

In [21]:
df_zgz['type'].unique()


array(['SALIDA CALZADA', 'COLISIÓN ALCANCE', 'COLIS FRONTOLATERAL',
       'OTRAS', 'ATROPELLO', 'CAIDA SOBRE CALZADA', 'COLIS. MARCHA ATRÁS',
       'COLISIÓN LATERAL'], dtype=object)