# API Pandas Folium

- API
- Pandas
- Folium,mapas

## Instalar librerías

Lo primero que tenemos que hacer es instalar la librería Panda, que proporciona herramientas que permiten leer y escribir datos en diferentes formatos: CSV, Microsoft Excel, bases SQL y formato HDF5. Además esta herramienta nos permite seleccionar y filtrar de manera sencilla tablas de datos en función de la posición, el valor o las propias etiquetas, así como fusionar y unir datos.

In [25]:
!pip install pandas folium



## Configurar librerías

La configuración de las librerías se basa en importarlas para usarlas en este cuaderno, lo hacemos con las siguientes funciones:

In [26]:
import pandas as pd
import folium

## Variables

Vamos a usar:
- La URL
- Y las coordenadas de Zaragoza, que llamaremos `coords_zrgz` y cuyas coordenadas exactas son `[41.649693, -0.887712]`
- Mapa, aunque más que una variable es un objeto. Lo haremos haciendo una llamada a `folium`

La primera variable que vamos a usar es la URL de donde queremos exportar los datos, en este caso la accidentalidad en el tráfico en la ciudad de Zaragoza. 

Para hacer el mapa llamaremos a la libreria folium, a la que le pediremos la localización y cuyo valor serán las coordenadas de Zaragoza, aquí llamadas `coords_zrgz`

In [27]:
url = 'https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=20'
coords_zrgz = [41.649693,-0.887712]
mapa = folium.Map(location=coords_zrgz)

Ahora tenemos que invocar al mapa, y se hace sencillamente escribiendo la palabra `mapa`, ya que es la palabra a la que le hemos dado el valor de las coordenadas de Zaragoza.

In [28]:
mapa

El siguiente paso es crear un data frame `df`, que es como llama Python a las tablas. Pero en esta ocasión tenemos que delimitar la url con el código `delimiter`, que en este caso es el punto y coma `;`. Así le estamos diciendo a la librería que lea la función de Panda `read csv`, pero como no esta delimitado por comas `,`, sino por puntos y comas `;`, se lo tenemos que decir para que muestre bien los datos.

In [29]:
df = pd.read_csv(url,delimiter=';')
df

Unnamed: 0,id,year,type,accidentType,firstAddress,secondAddress,geometry,reason,area,creationDate,daniosMateriales,falloMecanico,estadoPavimento,tipoEstadoPavimento,estadoAtmosfera,tipoEstadoAtmosfera,afectado,vehiculo
0,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,"COSTA, JOAQUIN","PERAL, ISAAC","-0.8818527060979306,41.649027473051156",PERDIDA del control por FALTA de ATENCIÓN,,2014-10-09T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
1,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,CADENA(MARQUES DE LA),,"-0.8645810716721081,41.661585829868585","DISTANCIA DE SEGURIDAD, no mantener",2560.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
2,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,"GOMEZ AVELLANEDA, G.","CASTRO, R. (POETA)","-0.887776415002892,41.666992622958105",PERDIDA del control por FALTA de ATENCIÓN,2598.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
3,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS FRONTOLATERAL,,MONZON,"GARCIA CONDOY, H.","-0.8825260453930127,41.62957498750602","CEDA EL PASO, no respetar prioridad de paso",2555.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
4,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,RIOJA,"NAVARRA, AVENIDA DE","-0.908314757720389,41.6562121210704",PERDIDA del control por VELOCIDAD INADECUADA,2554.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
5,https://www.zaragoza.es/sede/servicio/transpor...,2014,OTRAS,,MUEL,,"-0.8691088511672924,41.65949772773082",Caída de ocupante en Transporte Público,2578.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
6,https://www.zaragoza.es/sede/servicio/transpor...,2014,ATROPELLO,,"PIGNATELLI, RAMON VIA",,"-0.8880337913721866,41.633353667694024",PEATÓN cruza calz SIN PREFER. fuera de paso,2606.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
7,https://www.zaragoza.es/sede/servicio/transpor...,2014,CAIDA SOBRE CALZADA,,"ALIERTA, AV. CESAREO","AULA, LUIS","-0.8708838775078237,41.6390382112928",INVADIR otro carril en el mismo sentido de cir...,2583.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
8,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS. MARCHA ATRÁS,,"CERBUNA, PEDRO",,"-0.8970649943808023,41.64083344974765",PERDIDA del control por FALTA de ATENCIÓN,2556.0,2014-10-24T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
9,https://www.zaragoza.es/sede/servicio/transpor...,2013,COLISIÓN LATERAL,,ASALTO,"COCCI, JORGE","-0.8718525605769747,41.64904657717317",INVADIR otro carril en el mismo sentido de cir...,4657.0,2013-12-20T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...


## Exploración de la tabla

Ahora vamos a ver cuales son los nombres de las columnas, lo hacemos de la siguiente forma:

In [30]:
df.columns

Index(['id', 'year', 'type', 'accidentType', 'firstAddress', 'secondAddress',
       'geometry', 'reason', 'area', 'creationDate', 'daniosMateriales',
       'falloMecanico', 'estadoPavimento', 'tipoEstadoPavimento',
       'estadoAtmosfera', 'tipoEstadoAtmosfera', 'afectado', 'vehiculo'],
      dtype='object')

Queremos que nos muestre la geometría, lo hacemos con la siguiente función ya que hemos visto arriba cuáles son las categorías a las que podemos acceder. También podemos accedewr a otras como `year`, `creationDate` o `tipoEstadoAtmosfera`, entre otros.

In [31]:
df['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
5      -0.8691088511672924,41.65949772773082
6     -0.8880337913721866,41.633353667694024
7       -0.8708838775078237,41.6390382112928
8      -0.8970649943808023,41.64083344974765
9      -0.8718525605769747,41.64904657717317
10     -0.8964627561577849,41.64322365075108
11     -0.8778095796207178,41.68753087470739
12    -0.8812157329722801,41.661646612715046
13      -0.8762000299022707,41.6454384961757
14     -0.9089013552408617,41.65543768899759
15     -0.9004729973337304,41.65180346604993
16     -0.8917562993466011,41.65233828238132
17      -0.888856043735591,41.65040494617356
18    -0.8629911318784169,41.645335650478316
19    -0.8870207060655807,41.609992514227066
Name: geometry, dtype: object

La siguiente fórmula nos sirve para ver los tipos de datos que tiene el data frame. Hay `id`, `años`,`tipos`,`tipos de accidentes` y muchos otros que podemos ver a continuación:

In [32]:
df.info ()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 18 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   id                   20 non-null     object 
 1   year                 20 non-null     int64  
 2   type                 20 non-null     object 
 3   accidentType         0 non-null      float64
 4   firstAddress         20 non-null     object 
 5   secondAddress        11 non-null     object 
 6   geometry             20 non-null     object 
 7   reason               20 non-null     object 
 8   area                 18 non-null     float64
 9   creationDate         20 non-null     object 
 10  daniosMateriales     20 non-null     bool   
 11  falloMecanico        20 non-null     bool   
 12  estadoPavimento      20 non-null     object 
 13  tipoEstadoPavimento  0 non-null      float64
 14  estadoAtmosfera      20 non-null     object 
 15  tipoEstadoAtmosfera  0 non-null      float

La siguiente función nos sirve para conocer la información numérica, que realmente no nos aporta nada. A pesar de ello, es para conocer que existen y que podemos obtener estos datos.

In [33]:
df.describe ()

Unnamed: 0,year,accidentType,area,tipoEstadoPavimento,tipoEstadoAtmosfera
count,20.0,0.0,18.0,0.0,0.0
mean,2013.45,,3234.0,,
std,0.510418,,1551.515843,,
min,2013.0,,18.0,,
25%,2013.0,,2557.0,,
50%,2013.0,,2602.0,,
75%,2014.0,,4666.25,,
max,2014.0,,4780.0,,


Ahora vamos a ver los datos de la columna `type`. Y a esta columna le vamos a decir, encadenar, que haga una descripción de los valores únicos.

In [34]:
df['type'].unique()

array(['SALIDA CALZADA', 'COLISIÓN ALCANCE', 'COLIS FRONTOLATERAL',
       'OTRAS', 'ATROPELLO', 'CAIDA SOBRE CALZADA', 'COLIS. MARCHA ATRÁS',
       'COLISIÓN LATERAL'], dtype=object)

Las coordenadas deberían estar en la columna geometry, que nos da las coordenadas de las cosas que queremos después visualizar en un mapa interactivo en el que se muestren los accidentes en diversos puntos en el mapa.

In [35]:
df['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
5      -0.8691088511672924,41.65949772773082
6     -0.8880337913721866,41.633353667694024
7       -0.8708838775078237,41.6390382112928
8      -0.8970649943808023,41.64083344974765
9      -0.8718525605769747,41.64904657717317
10     -0.8964627561577849,41.64322365075108
11     -0.8778095796207178,41.68753087470739
12    -0.8812157329722801,41.661646612715046
13      -0.8762000299022707,41.6454384961757
14     -0.9089013552408617,41.65543768899759
15     -0.9004729973337304,41.65180346604993
16     -0.8917562993466011,41.65233828238132
17      -0.888856043735591,41.65040494617356
18    -0.8629911318784169,41.645335650478316
19    -0.8870207060655807,41.609992514227066
Name: geometry, dtype: object

La siguiente función type te dice que tipos de datos son, en este caso, la columna `geometry`

In [36]:
type(df['geometry'][0])

str

El resultado es un string `str`, una cadena de caracteres. Posteriormente deberemos separar esta cadena de caracteres por la coma `,`. ¿Cómo hacemos que se separe? Con la función `split`, como vemos a continuación, en la que le decimos a `geometry` que se separe por la coma `,`

In [37]:
df['geometry'][0].split(',')

['-0.8818527060979306', '41.649027473051156']

Ya tenemos algo que podemos empezar a manipular. De momento lo que vamos a hacer es crear un punto que se llamará `point`, y que va a tener los dos valores que hemos visto anteriormente. Si antes solo veiamos los datos, ahora estamos creando un punto geográfico, que nosotros hemos llamado `point`

In [38]:
point = df['geometry'][0].split(',')
point

['-0.8818527060979306', '41.649027473051156']

Ahora ya hemos creado un objeto nuevo, que toma los datos de esa columna y hace la división de los caracteres a partir de la coma. Lo que hacemos es haberle puesto un nombre a estos datos para poder llamarlos posteriormente con la palabra `point`

In [39]:
type(point)

list

Ahora, mediante esta fórmula, podemos saber que point es una lista, ya no es un string como habíamos visto al principio.

Ahora vamos a crear una serie, que es donde vamos a guardar uno de los elementos de cada una de las filas, en este caso longitud y latitud.

In [40]:
longitudes = []
latitudes = []

In [41]:
longitudes

[]

In [42]:
type(longitudes)

list

Ahora, para cada una de las filas le voy a crear un objeto que se llama longitud, que lo que hace es en esa fila hacer la separación que he hecho antes. La `i` es de input, que es cada uno de los elementos de la columna `geometry`. Con esto ya hemos hecho una acción para cada uno de los elementos dentro de la tabla de datos. Luego hemos llamado a `punto_coord` como la separación de cada una de las celdas de la columna `geometry`. Más tarde le damos un valor a las `longitudes` y le pedimos que nos muestre cuáles son.

In [43]:
for i in df ['geometry']:
    punto_coord = i.split(',')
    longitudes += [float(punto_coord[1])]
longitudes

[41.649027473051156,
 41.661585829868585,
 41.666992622958105,
 41.62957498750602,
 41.6562121210704,
 41.65949772773082,
 41.633353667694024,
 41.6390382112928,
 41.64083344974765,
 41.64904657717317,
 41.64322365075108,
 41.68753087470739,
 41.661646612715046,
 41.6454384961757,
 41.65543768899759,
 41.65180346604993,
 41.65233828238132,
 41.65040494617356,
 41.645335650478316,
 41.609992514227066]

In [44]:
for i in df ['geometry']:
    punto_coord = i.split(',')
    latitudes += [float(punto_coord[0])]
latitudes

[-0.8818527060979306,
 -0.8645810716721081,
 -0.887776415002892,
 -0.8825260453930127,
 -0.908314757720389,
 -0.8691088511672924,
 -0.8880337913721866,
 -0.8708838775078237,
 -0.8970649943808023,
 -0.8718525605769747,
 -0.8964627561577849,
 -0.8778095796207178,
 -0.8812157329722801,
 -0.8762000299022707,
 -0.9089013552408617,
 -0.9004729973337304,
 -0.8917562993466011,
 -0.888856043735591,
 -0.8629911318784169,
 -0.8870207060655807]

Ahora vamos a crear un data frame de las coordenadas, que unen los puntos de latitud y los de longitud. Nos dará como resultado una tabla, que veremos a continuación.

In [45]:
df_coord = pd.DataFrame({'long':longitudes,'lat':latitudes})
df_coord

Unnamed: 0,long,lat
0,41.649027,-0.881853
1,41.661586,-0.864581
2,41.666993,-0.887776
3,41.629575,-0.882526
4,41.656212,-0.908315
5,41.659498,-0.869109
6,41.633354,-0.888034
7,41.639038,-0.870884
8,41.640833,-0.897065
9,41.649047,-0.871853


Vamos a crear otro data frame que lo que va a hacer es, con la función de pandas de `concat`, concatenar la columna type del data frame original con el que hemos creado de coordenadas. Porque lo que queremos es una tabla que, además de la longitud y la latitud, nos muestre el tipo de accidente que ha ocurrido en cada coordenada.

In [46]:
df_accidentes = pd.concat([df['type'],df_coord],axis=1)
df_accidentes

Unnamed: 0,type,long,lat
0,SALIDA CALZADA,41.649027,-0.881853
1,COLISIÓN ALCANCE,41.661586,-0.864581
2,COLISIÓN ALCANCE,41.666993,-0.887776
3,COLIS FRONTOLATERAL,41.629575,-0.882526
4,SALIDA CALZADA,41.656212,-0.908315
5,OTRAS,41.659498,-0.869109
6,ATROPELLO,41.633354,-0.888034
7,CAIDA SOBRE CALZADA,41.639038,-0.870884
8,COLIS. MARCHA ATRÁS,41.640833,-0.897065
9,COLISIÓN LATERAL,41.649047,-0.871853


Vamos a crear un marcador, para que salgan los puntos en el mapa. Lo creamos con la función de folium que se llama `marker`. Esta funcion va a tener las coordenadas de Zaragoza y la información que queremos que se vea cuando se pase por ella el ratón. Luego le vamos a decir que datos queremos que muestre el objeto mapa, que añade como hijo el marcador.

In [47]:
marcador = folium.Marker(coords_zrgz, popup="¡Hola, Zaragoza!")
mapa = mapa.add_child(marcador)
mapa 

Ahora vamos a hacer un mapa con cada uno de los puntos que tiene nuestra tabla, previamente creada. Lo vamos a hacer con la función interrows, que significa que haga lo mismo para cada fila. Además de que lo hará también con los data frame creados anteriormente.

In [49]:
for index, fila in df_accidentes.iterrows():
    marcador = folium.Marker([fila['lat'],fila['long']],popup=fila['type'])
    mapa.add_child(marcador)
mapa