# API Pandas folium

- Api
- Pandas
- Folium

El primer paso es instalar el folium.

In [1]:
!pip install folium pandas



Una vez instaladas, las importamos.

In [2]:
import pandas as pd
import folium

A continuación, creamos las variables y añadimos las coordenadas de Zaragoza.

In [3]:
url_zrgz = 'https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=20'
coord_zrgz = [41.649693,-0.887712]

Para visualizar **el mapa** lo que hacemos es llamar a la librería folium y acudir a su función `map`. Así, le indicamos que utilize las coordenadas de Zaragoza.

In [4]:
mapa = folium.Map(location=coord_zrgz)

In [5]:
mapa

Crearemos un `dataframe` de accidentes. En este caso como aparece como csv y no como json le diremos *read csv*. Pero también tenemos que añadir el delimiter, puesto que a pesar de presentarse como csv está escrito con puntos y comas. 

In [6]:
df = pd.read_csv(url_zrgz,delimiter = ";")

Una vez creado el `dataframe` le diremos que nos muestre los nombres de las columnas para ver qué tipo de datos ofrece.

In [7]:
df.columns


Index(['id', 'year', 'type', 'accidentType', 'firstAddress', 'secondAddress',
       'geometry', 'reason', 'area', 'creationDate', 'daniosMateriales',
       'falloMecanico', 'estadoPavimento', 'tipoEstadoPavimento',
       'estadoAtmosfera', 'tipoEstadoAtmosfera', 'afectado', 'vehiculo'],
      dtype='object')

También añadiremos la función `info` para **conocer los tipos de datos** que hay. Gracias a los datos que nos ofrece podemos ver que nos ofrece 5 datos numéricos (float64 y int64). Por lo tanto, el siguiente paso será añadir la función `describe`.

In [8]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 18 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   id                   20 non-null     object 
 1   year                 20 non-null     int64  
 2   type                 20 non-null     object 
 3   accidentType         0 non-null      float64
 4   firstAddress         20 non-null     object 
 5   secondAddress        11 non-null     object 
 6   geometry             20 non-null     object 
 7   reason               20 non-null     object 
 8   area                 18 non-null     float64
 9   creationDate         20 non-null     object 
 10  daniosMateriales     20 non-null     bool   
 11  falloMecanico        20 non-null     bool   
 12  estadoPavimento      20 non-null     object 
 13  tipoEstadoPavimento  0 non-null      float64
 14  estadoAtmosfera      20 non-null     object 
 15  tipoEstadoAtmosfera  0 non-null      float

La siguiente información que obtenemos con la función `describe` da información sobre las columnas numéricas. En este caso **no es útil**. 

In [9]:
df.describe()

Unnamed: 0,year,accidentType,area,tipoEstadoPavimento,tipoEstadoAtmosfera
count,20.0,0.0,18.0,0.0,0.0
mean,2013.45,,3234.0,,
std,0.510418,,1551.515843,,
min,2013.0,,18.0,,
25%,2013.0,,2557.0,,
50%,2013.0,,2602.0,,
75%,2014.0,,4666.25,,
max,2014.0,,4780.0,,


Para acceder a una columna utilizaremos los corchetes. En este caso le pedimos la columna type. Pero como se repiten, le encadenamos que nos saque los valores unicos a traves de `unique`.

In [10]:
df ['type'].unique()

array(['SALIDA CALZADA', 'COLISIÓN ALCANCE', 'COLIS FRONTOLATERAL',
       'OTRAS', 'ATROPELLO', 'CAIDA SOBRE CALZADA', 'COLIS. MARCHA ATRÁS',
       'COLISIÓN LATERAL'], dtype=object)

In [11]:
df.columns

Index(['id', 'year', 'type', 'accidentType', 'firstAddress', 'secondAddress',
       'geometry', 'reason', 'area', 'creationDate', 'daniosMateriales',
       'falloMecanico', 'estadoPavimento', 'tipoEstadoPavimento',
       'estadoAtmosfera', 'tipoEstadoAtmosfera', 'afectado', 'vehiculo'],
      dtype='object')

En **geometry** es donde están las coordenadas, por eso se las pediremos a traves del `dataframe`. Aun así, python no lo entiende como coordenadas. 

In [12]:
df['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
5      -0.8691088511672924,41.65949772773082
6     -0.8880337913721866,41.633353667694024
7       -0.8708838775078237,41.6390382112928
8      -0.8970649943808023,41.64083344974765
9      -0.8718525605769747,41.64904657717317
10     -0.8964627561577849,41.64322365075108
11     -0.8778095796207178,41.68753087470739
12    -0.8812157329722801,41.661646612715046
13      -0.8762000299022707,41.6454384961757
14     -0.9089013552408617,41.65543768899759
15     -0.9004729973337304,41.65180346604993
16     -0.8917562993466011,41.65233828238132
17      -0.888856043735591,41.65040494617356
18    -0.8629911318784169,41.645335650478316
19    -0.8870207060655807,41.609992514227066
Name: geometry, dtype: object

Le pediremos la primera del índice. Encapsulandolo con la función `type` nos dirá qué tipo de dato es. Así, nos dice que es un string. Es decir, una cadena de valores.

In [13]:
type(df['geometry'][0])

str

¿Qué es lo que separa estos caracteres? La coma. Por lo tanto, crearemos una columna con los caracteres de la derecha y otro con los de la izquierda. Es decir, los vamos a **separar** de la siguiente manera con la función `split`. Así, nos devuelve **dos elementos**.  

In [14]:
df['geometry'][0].split(',')

['-0.8818527060979306', '41.649027473051156']

Crearemos un punto que va a ser igual a lo que hemos hecho aquí arriba. Así pues, **creamos un objeto nuevo** los datos de la primera fila separados entre sí. 

In [15]:
point = df ['geometry'][0].split(',')
point

['-0.8818527060979306', '41.649027473051156']

Podemos pedirle que nos diga **de qué tipo** son los datos del nuevo objeto que hemos creado. 

In [16]:
type(point)

list

Después, crearemos una serie con el nombre longitudes y otra con el nombre latitudes y le diremos que nos diga qué tipo de datos son.

In [17]:
longitudes = []
latitudes = []

In [18]:
longitudes


[]

In [19]:
latitudes

[]

In [20]:
type (longitudes)

list

A continuación, creamos un bucle. El `+=` hace que la lista longitudes sea igual a ese resultado. Así, al objeto **longitudes** le añadimos del punto de coordenadas (que ya lo hemos separado) el de la derecha, es decir el segundo valor. 

In [21]:
for i in df['geometry']:
    punto_coord = i.split(',')
    longitudes += [float(punto_coord[1])]


In [22]:
longitudes

[41.649027473051156,
 41.661585829868585,
 41.666992622958105,
 41.62957498750602,
 41.6562121210704,
 41.65949772773082,
 41.633353667694024,
 41.6390382112928,
 41.64083344974765,
 41.64904657717317,
 41.64322365075108,
 41.68753087470739,
 41.661646612715046,
 41.6454384961757,
 41.65543768899759,
 41.65180346604993,
 41.65233828238132,
 41.65040494617356,
 41.645335650478316,
 41.609992514227066]

Hacemos lo mismo con **latitudes**.

In [23]:
for i in df['geometry']:
    punto_coord = i.split(',')
    latitudes += [float(punto_coord[0])]
latitudes

[-0.8818527060979306,
 -0.8645810716721081,
 -0.887776415002892,
 -0.8825260453930127,
 -0.908314757720389,
 -0.8691088511672924,
 -0.8880337913721866,
 -0.8708838775078237,
 -0.8970649943808023,
 -0.8718525605769747,
 -0.8964627561577849,
 -0.8778095796207178,
 -0.8812157329722801,
 -0.8762000299022707,
 -0.9089013552408617,
 -0.9004729973337304,
 -0.8917562993466011,
 -0.888856043735591,
 -0.8629911318784169,
 -0.8870207060655807]

Cremos un `dataframe` (una tabla) y dentro de ella metemos las longitudes y latitudes. 

In [24]:
df_coord = pd.DataFrame({'long':longitudes,'lat':latitudes})
df_coord

Unnamed: 0,long,lat
0,41.649027,-0.881853
1,41.661586,-0.864581
2,41.666993,-0.887776
3,41.629575,-0.882526
4,41.656212,-0.908315
5,41.659498,-0.869109
6,41.633354,-0.888034
7,41.639038,-0.870884
8,41.640833,-0.897065
9,41.649047,-0.871853


Creamos otro `dataframe` con el nombre **accidentes** y añadimos la **función de pandas** `concat` para **concatenar** la columna type del `dataframe` original y añadir las coordenadas. Todo esto **en el eje uno**, que es el orizontal, para así añadirlo a la derecha. 

In [25]:
df_accidentes = pd.concat([df['type'], df_coord], axis=1)
df_accidentes

Unnamed: 0,type,long,lat
0,SALIDA CALZADA,41.649027,-0.881853
1,COLISIÓN ALCANCE,41.661586,-0.864581
2,COLISIÓN ALCANCE,41.666993,-0.887776
3,COLIS FRONTOLATERAL,41.629575,-0.882526
4,SALIDA CALZADA,41.656212,-0.908315
5,OTRAS,41.659498,-0.869109
6,ATROPELLO,41.633354,-0.888034
7,CAIDA SOBRE CALZADA,41.639038,-0.870884
8,COLIS. MARCHA ATRÁS,41.640833,-0.897065
9,COLISIÓN LATERAL,41.649047,-0.871853


Por último, **crearemos un punto** en el mapa con la función de Folium llamada `Marker`. Le decimos que este punto va a tener las **coordenadas de Zaragoza** y cuando pinchemos en el aparecerá la frase **"¡Hola Zaragoza!"**. Además, con la función `add_child` al objeto mapa añadimos como hijo el marcador. 

In [26]:
marcador = folium.Marker (coord_zrgz, popup="¡Hola, Zaragoza!")
mapa = mapa.add_child(marcador)
mapa

# Cómo cambiar el mapa 

En la funcion Map() de folium hay una propiedad tiles que puede tener como valor Stamen Terrain. Crea un mapa con las coordenadas de Madrid Y sobre ese mapa un marcador con la función Marker() de folium cuya propiedad icon tiene como valor folium.Icon(color="green"). Finalmente guardamos el mapa con save('tipo.tml')

In [30]:
coord = [40.4165,-3.70256]
mapa = folium.Map(location=coord, tiles='Stamen Terrain')
marcador = folium.Marker(coord, icon=folium.Icon(color="green"))
mapa = mapa.add_child(marcador)
mapa
                    

# Cómo guardar el mapa

Para guardar el mapa debemos insertar `mapa.save` y a continuación, añadir el nombre entre parentesis. 

In [32]:
mapa.save('mapa.html')