# API Pandas Folium

- API
- Pandas
- Folium,mapas

## Instalar librerías

El primer paso a realizar es instalar la librería Panda. Esto otorga herramientas que permiten leer y escribir datos en diferentes formatoscomo CSV, Microsoft Excel, bases SQL y formato HDF5. Además, esta herramienta da la opción de seleccionar y filtrar fácilmnete las tablas de datos en función de la posición, el valor o las propias etiquetas, así como fusionar y unir datos.

In [12]:
!pip install pandas folium



## Configurar librerías

La configuración de las librerías se basa en importarlas para utilizarlas en este notebook. Se consigue a través de estas funciones:

In [13]:
import pandas as pd
import folium

## Variables

Las variables que vamos a utilizar son estas:
- La URL
- Las coordenadas de la ciudad escigida, en este caso Zaragoza, que llamaremos `coords_zrgz` y cuyas coordenadas exactas son `[41.649693, -0.887712]`
- El mapa, que es una variable considerada también un objeto. Lo haremos haciendo una llamada a `folium`

La primera variable que vamos a usar es la URL de donde queremos exportar los datos, en este caso la accidentalidad en el tráfico en la ciudad de Zaragoza. 

Para hacer el mapa llamaremos a la libreria folium, a la que le pediremos la localización y cuyo valor serán las coordenadas de Zaragoza, aquí llamadas `coords_zrgz`

In [6]:
url = 'https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=100'
coords_zrgz = [41.649693,-0.887712]
mapa = folium.Map(location=coords_zrgz)

Ahora tenemos que colocar al mapa. Se escribe el término `mapa`, ya que es la palabra elegida para dar valor de las coordenadas de Zaragoza.

In [7]:
mapa

Creamos un data frame `df`, que es como llama Python a las tablas. Sin embargo, tenemos que delimitar el link con el código `delimiter`, que en este caso es el punto y coma `;`. Así le comunidcamos a la librería que lea la función de Panda `read csv`, pero como no delimitamos mediante comas `,`, sino por puntos y comas `;`, se lo tenemos que decir para que muestre bien los datos.

In [8]:
df = pd.read_csv(url,delimiter=';')
df

Unnamed: 0,id,year,type,accidentType,firstAddress,secondAddress,geometry,reason,area,creationDate,daniosMateriales,falloMecanico,estadoPavimento,tipoEstadoPavimento,estadoAtmosfera,tipoEstadoAtmosfera,afectado,vehiculo
0,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,"COSTA, JOAQUIN","PERAL, ISAAC","-0.8818527060979306,41.649027473051156",PERDIDA del control por FALTA de ATENCIÓN,,2014-10-09T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
1,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,CADENA(MARQUES DE LA),,"-0.8645810716721081,41.661585829868585","DISTANCIA DE SEGURIDAD, no mantener",2560.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
2,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,"GOMEZ AVELLANEDA, G.","CASTRO, R. (POETA)","-0.887776415002892,41.666992622958105",PERDIDA del control por FALTA de ATENCIÓN,2598.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
3,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS FRONTOLATERAL,,MONZON,"GARCIA CONDOY, H.","-0.8825260453930127,41.62957498750602","CEDA EL PASO, no respetar prioridad de paso",2555.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
4,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,RIOJA,"NAVARRA, AVENIDA DE","-0.908314757720389,41.6562121210704",PERDIDA del control por VELOCIDAD INADECUADA,2554.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
95,https://www.zaragoza.es/sede/servicio/transpor...,2014,OTRAS,,"MIRAL, DOMINGO",,"-0.8990662796872798,41.63977012001253",PERDIDA del control por FALTA de ATENCIÓN,,2014-07-30T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
96,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,"BUÑUEL,LUIS (PARQUE DEL AGUA)",,"-0.9072756956226459,41.670910841846876",PERDIDA del control por FALTA de ATENCIÓN,2071.0,2014-07-31T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
97,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,"ALBAR, MANUEL GL.","ILUSTRACION, AV. DE LA","-0.9226018969034585,41.62757051008441",PERDIDA del control por FALTA de ATENCIÓN,1969.0,2014-07-25T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
98,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS FRONTOLATERAL,,ECHEGARAY Y CABALLERO,SAN VICENTE PAUL,"-0.8735234620830842,41.65507219335992","SEMÁFORO, no respetar prioridad de paso",1970.0,2014-07-26T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...


## Exploración de la tabla

Ahora vamos a ver cuales son los nombres de las columnas:

In [9]:
df.columns

Index(['id', 'year', 'type', 'accidentType', 'firstAddress', 'secondAddress',
       'geometry', 'reason', 'area', 'creationDate', 'daniosMateriales',
       'falloMecanico', 'estadoPavimento', 'tipoEstadoPavimento',
       'estadoAtmosfera', 'tipoEstadoAtmosfera', 'afectado', 'vehiculo'],
      dtype='object')

Para que nos enseñe la geometría, lo hacemos con la misma función vista arriba, qué categorías son a las que podemos acceder. También podemos  a otras como `year`, `creationDate` o `tipoEstadoAtmosfera`, entre más opciones.

In [10]:
df['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
                       ...                  
95     -0.8990662796872798,41.63977012001253
96    -0.9072756956226459,41.670910841846876
97     -0.9226018969034585,41.62757051008441
98     -0.8735234620830842,41.65507219335992
99     -0.8869504077778204,41.65022964156985
Name: geometry, Length: 100, dtype: object

In [14]:
df.info ()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100 entries, 0 to 99
Data columns (total 18 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   id                   100 non-null    object 
 1   year                 100 non-null    int64  
 2   type                 100 non-null    object 
 3   accidentType         0 non-null      float64
 4   firstAddress         100 non-null    object 
 5   secondAddress        48 non-null     object 
 6   geometry             100 non-null    object 
 7   reason               100 non-null    object 
 8   area                 79 non-null     float64
 9   creationDate         100 non-null    object 
 10  daniosMateriales     100 non-null    bool   
 11  falloMecanico        100 non-null    bool   
 12  estadoPavimento      100 non-null    object 
 13  tipoEstadoPavimento  0 non-null      float64
 14  estadoAtmosfera      100 non-null    object 
 15  tipoEstadoAtmosfera  0 non-null      floa

A info le añadimos unos parénteisis porque es una función. Para ver los tipo de datos que tiene el dataframe que viene de la URL de la api de Zaragoza. El object es un texto natural, es decir, un accidente por ejemplo, allí donde hay texto. Es un texto que hace referencia a algo.
Ahora hacemos la función describe. Nos sive porque nos da información sobre la columnas númericas, en este caso son años.

In [15]:
df.describe()

Unnamed: 0,year,accidentType,area,tipoEstadoPavimento,tipoEstadoAtmosfera
count,100.0,0.0,79.0,0.0,0.0
mean,2013.59,,3341.56962,,
std,0.494311,,1225.936991,,
min,2013.0,,17.0,,
25%,2013.0,,2604.5,,
50%,2014.0,,2659.0,,
75%,2014.0,,4627.5,,
max,2014.0,,4783.0,,


La próxima opción es type que es una columna que la encadeno a la descripción de los valores únicos: salida, alcance, calzada o colisión frontal. Así se ven las valores de la columna type, qué valores únicos hay.

In [18]:
df['type'].unique()

array(['SALIDA CALZADA', 'COLISIÓN ALCANCE', 'COLIS FRONTOLATERAL',
       'OTRAS', 'ATROPELLO', 'CAIDA SOBRE CALZADA', 'COLIS. MARCHA ATRÁS',
       'COLISIÓN LATERAL'], dtype=object)

Me voy a geometry de la misma forma que he accedido a type. Lo que aparece son filas con números de principio a fin. En la columna geometry selecciono una opción en concreto y lo encapsulo. Hay que acceder a la fila 0 mediante la función `type` que dice qué tipo de datos es. Lo que leo es un string, una línea de caracteres.

In [19]:
df['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
                       ...                  
95     -0.8990662796872798,41.63977012001253
96    -0.9072756956226459,41.670910841846876
97     -0.9226018969034585,41.62757051008441
98     -0.8735234620830842,41.65507219335992
99     -0.8869504077778204,41.65022964156985
Name: geometry, Length: 100, dtype: object

In [21]:
type(df['geometry'][0])

str

Esta cadena de caracteres la tenemos que separar a través de una coma , separamos los datos de la izquierda y la derecha. Las separamos con la función split y el separador se entrecomilla.

In [23]:
df['geometry'][0].split(',')

['-0.8818527060979306', '41.649027473051156']

Se ha creado una lista que se puede comenzar a manipular. He creado una tabla nueva con una sola fila. Creamos un punto llamado `point` igual a lo realizado anteriormente, es decir, mirar a la celda de la columna geometría. La dividimos con la coma, el resultado es el mismo, hemos credao un objeto nuevo que crea los datos de esa columna y hace la división que es una cadena de caracteres.

In [26]:
point = df['geometry'][0].split(',')
point

['-0.8818527060979306', '41.649027473051156']

Con la siguiente función, `point`es ahora una lista de dos elementos

In [27]:
type(point)

list

Creamos una serie que la denominamos `longitudes` para guardar elementos. Tambiém creamos `latitudes`, son dos listas sin datos

In [29]:
longitudes = []
latitudes = []

In [30]:
longitudes

[]

In [31]:
type(longitudes)

list

For es un elemento input, llamamos a cualquier elemento que hace el bucle. Lo denominamos`for i`. Para cada uno de los elementos del dataframe geometry voy a hacer un split para separar. Para cada una de las filas, la i, hace una separación.
Hacemos un for, un bucle, para cada uno de los elementos de la tabla de datos, solo lo aplicamos a los elementos de la columna `geometry`. Vamos a llamar al punto de coordenadas la separación entre las celdas de punto geometry. Añadimos al objeto longitudes el segundo valor de punto coordenadas.

In [35]:
for i in df['geometry']:
    punto_coord = i.split(',')
    longitudes += [float(punto_coord[1])]
longitudes

[41.649027473051156,
 41.661585829868585,
 41.666992622958105,
 41.62957498750602,
 41.6562121210704,
 41.65949772773082,
 41.633353667694024,
 41.6390382112928,
 41.64083344974765,
 41.64904657717317,
 41.64322365075108,
 41.68753087470739,
 41.661646612715046,
 41.6454384961757,
 41.65543768899759,
 41.65180346604993,
 41.65233828238132,
 41.65040494617356,
 41.645335650478316,
 41.609992514227066,
 41.63379905763323,
 41.63275556609146,
 41.63808926467497,
 41.677487884305975,
 41.620591734015946,
 41.64931371437485,
 41.646890443474554,
 41.62404668544956,
 41.63964884250951,
 41.638477534601776,
 41.64332496247496,
 41.65260977469196,
 41.65248328671194,
 41.6474034449745,
 41.64926981833846,
 41.650740541708075,
 41.638807389014836,
 41.66374540604866,
 41.64886535549928,
 41.63265453864093,
 41.67281318904247,
 41.66895757951277,
 41.71496486522088,
 41.67007665525934,
 41.63484525009101,
 41.64060309287472,
 41.66210291413718,
 41.63348367532985,
 41.67593597602368,
 41.6721066

Seguimos el mismo procedimeinto con `latitudes`

In [36]:
for i in df['geometry']:
    punto_coord = i.split(',')
    latitudes += [float(punto_coord[0])]
latitudes

[-0.8818527060979306,
 -0.8645810716721081,
 -0.887776415002892,
 -0.8825260453930127,
 -0.908314757720389,
 -0.8691088511672924,
 -0.8880337913721866,
 -0.8708838775078237,
 -0.8970649943808023,
 -0.8718525605769747,
 -0.8964627561577849,
 -0.8778095796207178,
 -0.8812157329722801,
 -0.8762000299022707,
 -0.9089013552408617,
 -0.9004729973337304,
 -0.8917562993466011,
 -0.888856043735591,
 -0.8629911318784169,
 -0.8870207060655807,
 -0.8636325074780108,
 -0.8760724207544668,
 -0.9036852209830768,
 -0.8896980442453839,
 -0.9018264648858587,
 -0.9187726932212442,
 -0.8855988456901538,
 -0.887523212911549,
 -0.8863120908790753,
 -0.8689640327130923,
 -0.8900650666830714,
 -0.8918524618079099,
 -0.9104038365599549,
 -0.8850103896969528,
 -0.8734135018983006,
 -0.8593239531218387,
 -0.868891092151338,
 -0.9008107424460443,
 -0.9211220937948997,
 -0.9026681648170423,
 -0.8893162332922886,
 -0.8890866503471749,
 -0.8439506345833918,
 -0.8665477541801948,
 -0.8848493117953854,
 -0.91470145036

Ahora realizamos un dataframe de las coordenadas de las dos columnas, longitudes y latitudes

In [38]:
df_coord = pd.DataFrame({'long':longitudes,'lat':latitudes})
df_coord

Unnamed: 0,long,lat
0,41.649027,-0.881853
1,41.661586,-0.864581
2,41.666993,-0.887776
3,41.629575,-0.882526
4,41.656212,-0.908315
...,...,...
95,41.639770,-0.899066
96,41.670911,-0.907276
97,41.627571,-0.922602
98,41.655072,-0.873523


Creamos otro dataframe denominado `accidentes`que va aconcotenar el dataframe primero con el creado de coordenadas. 

In [40]:
df_accidentes = pd.concat([df['type'],df_coord],axis=1)
df_accidentes

Unnamed: 0,type,long,lat
0,SALIDA CALZADA,41.649027,-0.881853
1,COLISIÓN ALCANCE,41.661586,-0.864581
2,COLISIÓN ALCANCE,41.666993,-0.887776
3,COLIS FRONTOLATERAL,41.629575,-0.882526
4,SALIDA CALZADA,41.656212,-0.908315
...,...,...,...
95,OTRAS,41.639770,-0.899066
96,COLISIÓN ALCANCE,41.670911,-0.907276
97,SALIDA CALZADA,41.627571,-0.922602
98,COLIS FRONTOLATERAL,41.655072,-0.873523


El siguiente pasio es cerar un marcador para que aparezca un punto en el apa con la función de folium que se llama marker. Va atener las coordenadas de Zaragoza y en el pop up, la información  que salga cuando pinche, saldrá Zaragoza. Le tenemos que decir al mapa que añada el marcador, y luego que muestre el mapa.

In [43]:
marcador = folium.Marker(coords_zrgz, popup="¡Hola, Zaragoza!")
mapa = mapa.add_child(marcador)
mapa

Vamos a hacer un mapa con todos los puntos que tiene nuestra tabla. La función `iterrows` siginifca marca todo por cada fila.

In [44]:
for indice, fila in df_accidentes.iterrows():
    marcador = folium.Marker([fila['lat'],fila['long']],\
                            popup=fila['type'])
    mapa.add_child(marcador)
mapa