# Actividad Dirigida 4: API Pandas Folium
- API
- Pandas
- Folium, mapas

En esta actividad dirigida analizaremos la información de los accidentes de tráfico en la provincia de Zaragoza a través de la siguiente [URL](https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente/ "Accidentes Zaragoza") y obtendremos los datos para la elaboración de mapas.

Para ello, los pasos que se seguirán en este código serán los siguientes:
1. Instalar librerías
2. Configuración de librerías
3. Variables
4. Explorar valores
5. Separación de valores
6. Generar bucle ```for``` para obtener los datos
7. Creación de *DataFrame*

## Instalar librerías

Lo primero que debemos hacer es instalar la librería [Pandas](https://pandas.pydata.org "Pandas") que se trata de una herramienta de análisis y manipulación de datos en código abierto construida sobre el lenguaje de programación Python y [Folium](https://python-visualization.github.io/folium/ "Folium") para facilitar la visualización de los datos de Python en un mapa interactivo. Para ello, haremos uso de la orden ```!pip install pandas folium```, ya que el ```pip``` es un gestor de paquetes estándar para este lenguaje que permite que se instalen y gestionen las librerías que no forman parte de la biblioteca estándar de Python.

In [2]:
!pip install pandas folium



## Configurar librerías

Tras este primer paso, lo siguiente será configurar e introducir la librería de Pandas en este código y darle a pandas el alias de pd a través de la orden ```import pandas as pd```. La librería Folium también se configurará en este código, pero en este caso no le daremos ningún alias.

In [3]:
import pandas as pd
import folium

## Variables
- url
- coords_zrgz: [41.649693,-0.887712]
- mapa (realmente es un objeto)

Hemos creado dos variables, la url y las coordenadas, que contienen la longitud y la latitud
En paso, lo primero que debemos hacer es definir la [URL](https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=20 "Accidentes Zaragoza") en la que queremos hacer web scraping y obtener los datos. En este caso,  usaremos la orden ```url = 'https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=20'``` para recabar la lista de accidentes de tráfico que se han producido en Zaragoza.

Tras este paso, definiremos las coordenadas de Zaragoza y le asignaremos una longitud y latitud concreta a través de la siguiente función: ```coords_zrgz = [41.649693,-0.887712]```, creando la variable ```coords_zrgz```.

Finalmente, haremos uso de la función ```folium.Map``` para crear el mapa de las coordenadas de Zaragoza que han sido definidas previamente y después simplemente introduciremos la orden ```map``` para que nos imprima el mapa que acabamos de crear en la latitud y longitud establecidas.

In [4]:
url = 'https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=20'
coords_zrgz = [41.649693,-0.887712]
mapa = folium.Map(location=coords_zrgz)

In [5]:
mapa

Tras este paso, haremos uso de la estrucutra de datos, DataFrame, es decir, ```df``` para guardar la información obtenida de distintos tipos en columnas como si fuera una hoja de cálculo. Después, utilizaremos la siguiente función:  ```df = pd.read_csv(url,delimiter=';')``` para leer un archivo de valores separados por comas (csv) de la url previamente definida en DataFrame, pero que en este caso el delimitador **no es una coma**, sino que es un **punto y coma**. Para finalizar simplemente introduciermos la orden  ```df``` para que nos imprima la tabla de la [URL](https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=20 "Accidentes Zaragoza") de la que queremos obtener los datos.

In [6]:
df = pd.read_csv(url,delimiter=';')
df

Unnamed: 0,id,year,type,accidentType,firstAddress,secondAddress,geometry,reason,area,creationDate,daniosMateriales,falloMecanico,estadoPavimento,tipoEstadoPavimento,estadoAtmosfera,tipoEstadoAtmosfera,afectado,vehiculo
0,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,"COSTA, JOAQUIN","PERAL, ISAAC","-0.8818527060979306,41.649027473051156",PERDIDA del control por FALTA de ATENCIÓN,,2014-10-09T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
1,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,CADENA(MARQUES DE LA),,"-0.8645810716721081,41.661585829868585","DISTANCIA DE SEGURIDAD, no mantener",2560.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
2,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,"GOMEZ AVELLANEDA, G.","CASTRO, R. (POETA)","-0.887776415002892,41.666992622958105",PERDIDA del control por FALTA de ATENCIÓN,2598.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
3,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS FRONTOLATERAL,,MONZON,"GARCIA CONDOY, H.","-0.8825260453930127,41.62957498750602","CEDA EL PASO, no respetar prioridad de paso",2555.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
4,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,RIOJA,"NAVARRA, AVENIDA DE","-0.908314757720389,41.6562121210704",PERDIDA del control por VELOCIDAD INADECUADA,2554.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
5,https://www.zaragoza.es/sede/servicio/transpor...,2014,OTRAS,,MUEL,,"-0.8691088511672924,41.65949772773082",Caída de ocupante en Transporte Público,2578.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
6,https://www.zaragoza.es/sede/servicio/transpor...,2014,ATROPELLO,,"PIGNATELLI, RAMON VIA",,"-0.8880337913721866,41.633353667694024",PEATÓN cruza calz SIN PREFER. fuera de paso,2606.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
7,https://www.zaragoza.es/sede/servicio/transpor...,2014,CAIDA SOBRE CALZADA,,"ALIERTA, AV. CESAREO","AULA, LUIS","-0.8708838775078237,41.6390382112928",INVADIR otro carril en el mismo sentido de cir...,2583.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
8,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS. MARCHA ATRÁS,,"CERBUNA, PEDRO",,"-0.8970649943808023,41.64083344974765",PERDIDA del control por FALTA de ATENCIÓN,2556.0,2014-10-24T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
9,https://www.zaragoza.es/sede/servicio/transpor...,2013,COLISIÓN LATERAL,,ASALTO,"COCCI, JORGE","-0.8718525605769747,41.64904657717317",INVADIR otro carril en el mismo sentido de cir...,4657.0,2013-12-20T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...


## Explorar valores

El siguiente paso que hemos llevado a cabo ha sido la exploración de las diferentes funciones para comprobar que dependiendo de si se establecía una u otra, los resultados que se imprimían eran diferentes:
- En el caso de la orden ```df.columns```, esta sirve para devolver los nombres de las columnas del DataFrame
- En la orden ```df['geometry']``` lo que solicitamos es que se cree una lista (al haber usado los corchetes) de la columna geometry, que tras imprimirlo, podemos comprobar que tiene los valores separados por comas, como si se tratase de un csv en bruto.
- En el caso de la orden ```df.info()``` esta es utilizada para obtener un resumen conciso del marco de datos mostrando el total de columnas existentes, así como el tipo de dato que es: bool (ej: verdadero o falso), float64 (ej: formato coma flotante), int64 (ej:valor inmutable) y object (ej: texto).
- La orden ```df.describe()``` se utiliza para mostrar aquellos datos estadísticos básicos como pueden ser las medias, el máximo, el mínimo o percentiles, entre otros.

In [7]:
df.columns

Index(['id', 'year', 'type', 'accidentType', 'firstAddress', 'secondAddress',
       'geometry', 'reason', 'area', 'creationDate', 'daniosMateriales',
       'falloMecanico', 'estadoPavimento', 'tipoEstadoPavimento',
       'estadoAtmosfera', 'tipoEstadoAtmosfera', 'afectado', 'vehiculo'],
      dtype='object')

In [8]:
df['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
5      -0.8691088511672924,41.65949772773082
6     -0.8880337913721866,41.633353667694024
7       -0.8708838775078237,41.6390382112928
8      -0.8970649943808023,41.64083344974765
9      -0.8718525605769747,41.64904657717317
10     -0.8964627561577849,41.64322365075108
11     -0.8778095796207178,41.68753087470739
12    -0.8812157329722801,41.661646612715046
13      -0.8762000299022707,41.6454384961757
14     -0.9089013552408617,41.65543768899759
15     -0.9004729973337304,41.65180346604993
16     -0.8917562993466011,41.65233828238132
17      -0.888856043735591,41.65040494617356
18    -0.8629911318784169,41.645335650478316
19    -0.8870207060655807,41.609992514227066
Name: geometry, dtype: object

In [9]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 18 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   id                   20 non-null     object 
 1   year                 20 non-null     int64  
 2   type                 20 non-null     object 
 3   accidentType         0 non-null      float64
 4   firstAddress         20 non-null     object 
 5   secondAddress        11 non-null     object 
 6   geometry             20 non-null     object 
 7   reason               20 non-null     object 
 8   area                 18 non-null     float64
 9   creationDate         20 non-null     object 
 10  daniosMateriales     20 non-null     bool   
 11  falloMecanico        20 non-null     bool   
 12  estadoPavimento      20 non-null     object 
 13  tipoEstadoPavimento  0 non-null      float64
 14  estadoAtmosfera      20 non-null     object 
 15  tipoEstadoAtmosfera  0 non-null      float

In [10]:
df.describe ()

Unnamed: 0,year,accidentType,area,tipoEstadoPavimento,tipoEstadoAtmosfera
count,20.0,0.0,18.0,0.0,0.0
mean,2013.45,,3234.0,,
std,0.510418,,1551.515843,,
min,2013.0,,18.0,,
25%,2013.0,,2557.0,,
50%,2013.0,,2602.0,,
75%,2014.0,,4666.25,,
max,2014.0,,4780.0,,


Tras explorar estos valores, a través de la función ```df['type'].unique()```, esta nos dirá el tipo de accidentes que existen en el DataFrame devolviendo valores únicos de la tabla y después utilizaremos la orden ```'type(df['geometry'][0])``` para imprimir la primera celda de la columna geometry y nos diga del tipo de dato que es, que en este caso es un string ```str```, es decir, una cadena de caracteres o texto natural.

In [11]:
df['type'].unique()

array(['SALIDA CALZADA', 'COLISIÓN ALCANCE', 'COLIS FRONTOLATERAL',
       'OTRAS', 'ATROPELLO', 'CAIDA SOBRE CALZADA', 'COLIS. MARCHA ATRÁS',
       'COLISIÓN LATERAL'], dtype=object)

In [12]:
type(df['geometry'][0])

str

## Separación de valores

En este paso, la función que utilizaremos será la siguiente: ```df['geometry'][0].split(',')```. La orden ```split``` se utiliza para separar a través de la coma los datos en dos partes, y por tanto, en este caso, se realizará la divisón de la primera celda de la columna geometry.

Tras ello, estableceremos la siguiente función ```point = df['geometry'][0].split(',')``` para crear un punto de este DataFrame que tiene longitud y latitud. Por tanto, al realizar la separación e introducir la orden ```type(point)``` se puede comprobar que el dato ya no es una cadena de caracteres, sino que se ha creado una lista.

In [13]:
df['geometry'][0].split(',')

['-0.8818527060979306', '41.649027473051156']

In [14]:
point = df['geometry'][0].split(',')
point

['-0.8818527060979306', '41.649027473051156']

In [15]:
type(point)

list

Depués creamos **dos listas** con el uso de corchetes, la de ```longitudes = []``` y la de ```latitudes = []``` que por el momento están vacías, ya que no contiene ningún dato.

In [16]:
longitudes = []
latitudes = []

## Generar bucle ```for``` para obtener los datos

El siguiente paso será rellenar la lista de ```longitudes = []```, y para ello crearemos el bucle ```for``` para ```i``` (input), que hace referencia a cada uno de los elementos que aparece en la columna geometry del Data Frame ```df```. 
Después crearemos la función ```punto_coord = i.split (',')``` para que cada uno de los elementos de la columna se separen por comas, a través de la orden ```split```. Asimismo, a la lista de longitudes le pondremos += y entrecorchetes el número 1, ya que imprimirá el segundo elemento de la lista al poner este número (todos ellos serán decimales, ya que hemos establecido la orden ```float```), e irá de corrido hasta que terminen todas las coordenadas. Finalmente introduciremos simplemente la orden ```longitudes``` para que nos imprima esta lista.

En la lista de ```latitudes = []``` seguiremos los mismos pasos, aunque en este caso al ser el primer elemento de la lista, se pondrá el 0 en vez del 1.

In [17]:
for i in df['geometry']:
    punto_coord = i.split (',')
    longitudes += [float(punto_coord[1])]
longitudes

[41.649027473051156,
 41.661585829868585,
 41.666992622958105,
 41.62957498750602,
 41.6562121210704,
 41.65949772773082,
 41.633353667694024,
 41.6390382112928,
 41.64083344974765,
 41.64904657717317,
 41.64322365075108,
 41.68753087470739,
 41.661646612715046,
 41.6454384961757,
 41.65543768899759,
 41.65180346604993,
 41.65233828238132,
 41.65040494617356,
 41.645335650478316,
 41.609992514227066]

In [18]:
for i in df['geometry']:
    punto_coord = i.split (',')
    latitudes += [float(punto_coord[0])]
latitudes

[-0.8818527060979306,
 -0.8645810716721081,
 -0.887776415002892,
 -0.8825260453930127,
 -0.908314757720389,
 -0.8691088511672924,
 -0.8880337913721866,
 -0.8708838775078237,
 -0.8970649943808023,
 -0.8718525605769747,
 -0.8964627561577849,
 -0.8778095796207178,
 -0.8812157329722801,
 -0.8762000299022707,
 -0.9089013552408617,
 -0.9004729973337304,
 -0.8917562993466011,
 -0.888856043735591,
 -0.8629911318784169,
 -0.8870207060655807]

## Creación de *DataFrame*

Tras generar los bucles, ahora vamos a crear un data frame (es decir, una tabla) de las dos series de coordenadas que hemos creado previamente, es decir, tanto de longitud como de latitud. A esta tabla le daremos el nombre de ```df_coord``` y dentro de esta estableceremos un esquema de un diccionario en el que llamamos a los objetos que ya están creados previamente de la serie longitudes y latitudes. 

In [19]:
df_coord = pd.DataFrame({'long':longitudes, 'lat':latitudes})
df_coord

Unnamed: 0,long,lat
0,41.649027,-0.881853
1,41.661586,-0.864581
2,41.666993,-0.887776
3,41.629575,-0.882526
4,41.656212,-0.908315
5,41.659498,-0.869109
6,41.633354,-0.888034
7,41.639038,-0.870884
8,41.640833,-0.897065
9,41.649047,-0.871853


Tras establecer la tabla, después a través de la función ```pd.concat([df['type'],df_coord],axis=1)``` concatenaremos los tipos de accidentes que se encuentran en el dataframe con la tabla de coordenadas creada previamente. Además, para que en vez de ponerse debajo en la misma fila (axis=0) se ponga en la derecha creando una nueva columna, añadimos el axis=1.

In [20]:
df_accidentes = pd.concat([df['type'],df_coord],axis=1)
df_accidentes

Unnamed: 0,type,long,lat
0,SALIDA CALZADA,41.649027,-0.881853
1,COLISIÓN ALCANCE,41.661586,-0.864581
2,COLISIÓN ALCANCE,41.666993,-0.887776
3,COLIS FRONTOLATERAL,41.629575,-0.882526
4,SALIDA CALZADA,41.656212,-0.908315
5,OTRAS,41.659498,-0.869109
6,ATROPELLO,41.633354,-0.888034
7,CAIDA SOBRE CALZADA,41.639038,-0.870884
8,COLIS. MARCHA ATRÁS,41.640833,-0.897065
9,COLISIÓN LATERAL,41.649047,-0.871853


Para visualizar la concatenación que acabamos de realizar, establecemos un marcador para crear un punto en el mapa a través de la función ```folium.Marker``` que tendrá las coordenadas de Zaragoza. Cuando pinche sobre ese marcador aparecerá el popup con el mensaje de Zaragoza. Asimismo, al objeto mapa, le añadiremos el método ```mapa.add_child``` para asignarle al mapa un hijo. Finalmente introduciremos simplemente la orden ```mapa``` para que nos imprima esta visualización.


In [21]:
marcador = folium.Marker(coords_zrgz, popup='Zaragoza')
mapa = mapa.add_child (marcador)
mapa

```iterrows```: Es una función que signifa itera por cada fila, es decir, que da la orden de hacer lo mismo por cada una de las filas. 

In [22]:
for indice, fila in df_accidentes.iterrows():
    marcador = folium.Marker ([fila['lat'],fila['long']], \
                             popup=fila['type'])
    mapa.add_child(marcador)
mapa

In [23]:
!pip install pandas folium
import pandas as pd
import folium
url =  'https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=20'
coord = [41.64,-0.88]
mapa = folium.Map(location=coord)
df = pd.read_csv(url,delimiter=';')
longitudes = []
for i in df['geometry']:
    longlat = i.split(',')
    longitudes += [float(longlat[0])]
latitudes = []
for i in df['geometry']:
    longlat = i.split(',')
    latitudes += [float(longlat[1])]
df_coord = pd.DataFrame({'long':longitudes, 'lat':latitudes})
df_tipo = pd.concat ([df['type'],df_coord],axis=1)
for index, fila in df_tipo.iterrows():
    marcador = folium.Marker([fila['lat'],fila['long']],popup=fila['type'])
    mapa.add_child(marcador)
mapa
    



## Mapa con icono y guardar mapa

In [24]:
!pip install pandas folium
import pandas as pd
import folium
coord = [40.41,-3.70]
mapa = folium.Map(location=coord, tiles='Stamen Terrain')
marcador = folium.Marker(coord, icon=folium.Icon(color='green'))
mapa.add_child(marcador)
mapa



In [25]:
mapa.save('madrid.html')