# API Pandas Folium
- API
- Pandas
- Folium, mapas

En la **Actividad dirigida 4** se analizó la información de los accidentes de tráfico en [Zaragoza](https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente/), con el propósito de obtener los datos para la elaboración de mapas y marcadores. 

## Instalar librerías 

En el primer paso del ejercicio se instaló la libreria [Pandas](https://pandas.pydata.org/),para estudiar y manipular datos en código abierto construida sobre el lenguaje de Python. Para esto, se hace uso de la herramienta `!pip install pandas folium`, 

In [1]:
!pip install pandas folium

Collecting folium
  Downloading folium-0.12.1.post1-py2.py3-none-any.whl (95 kB)
Collecting branca>=0.3.0
  Downloading branca-0.4.2-py3-none-any.whl (24 kB)
Installing collected packages: branca, folium
Successfully installed branca-0.4.2 folium-0.12.1.post1


## Configurar librerías

Utilizamos `import pandas as pd` para importar la biblioteca de análisis de pandas a python, entorno dónde se está realizando la actividad. A su vez, también le pide que denomine el alias de `pd`, el cual será utilizado más adelante en otras funciones

In [2]:
import pandas as pd
import folium

## Variables 
- url: http:\\www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=100
- coords_zrgz
- mapa

Este es un paso muy importante pues aquí es donde se define la URL de la que se desea extraer los datos. En este caso fue el enlace para conocer la lista de accidentes de tráfico que se han registrado en [Zaragoza](https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=20).


In [3]:
url = 'https://www.zaragoza.es/sede/servicio/transporte/accidentalidad-trafico/accidente.csv?rows=20'
coords_zrgz = [41.649693,-0.887712]

Después, se definieron las coordenadas de Zaragoza y le asignaron una `longitud` y `latitud` mediante la función `coords_zrgz = [41.649693,-0.887712]`, y creando la variable `coords_zrgz` con la que se identificarán estos datos.

In [4]:
mapa = folium.Map(location=coords_zrgz)

Luego, se utilizó la función `folium.Map` con el fin de crear un mapa de las coordenadas de Zaragoza establecidas anteriormente y, para imprimir este gráfico en el programa, se usó la orgen `mapa`.

In [5]:
mapa

Tras este paso, se hizo uso de la estructura de datos `DataFrame`, que se definió como `df` para guardar la información en diferentes columnas y la función `df = pd.read_csv(url,delimiter=';')` para leer un archivo de valores separados por puntos y comas (csv) de la url. Luego, se ejecuta `df` para que muestre la tabla de datos obtenidos. 

In [6]:
df = pd.read_csv(url,delimiter=';')
df

Unnamed: 0,id,year,type,accidentType,firstAddress,secondAddress,geometry,reason,area,creationDate,daniosMateriales,falloMecanico,estadoPavimento,tipoEstadoPavimento,estadoAtmosfera,tipoEstadoAtmosfera,afectado,vehiculo
0,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,"COSTA, JOAQUIN","PERAL, ISAAC","-0.8818527060979306,41.649027473051156",PERDIDA del control por FALTA de ATENCIÓN,,2014-10-09T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
1,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,CADENA(MARQUES DE LA),,"-0.8645810716721081,41.661585829868585","DISTANCIA DE SEGURIDAD, no mantener",2560.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
2,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLISIÓN ALCANCE,,"GOMEZ AVELLANEDA, G.","CASTRO, R. (POETA)","-0.887776415002892,41.666992622958105",PERDIDA del control por FALTA de ATENCIÓN,2598.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
3,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS FRONTOLATERAL,,MONZON,"GARCIA CONDOY, H.","-0.8825260453930127,41.62957498750602","CEDA EL PASO, no respetar prioridad de paso",2555.0,2014-10-23T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
4,https://www.zaragoza.es/sede/servicio/transpor...,2014,SALIDA CALZADA,,RIOJA,"NAVARRA, AVENIDA DE","-0.908314757720389,41.6562121210704",PERDIDA del control por VELOCIDAD INADECUADA,2554.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
5,https://www.zaragoza.es/sede/servicio/transpor...,2014,OTRAS,,MUEL,,"-0.8691088511672924,41.65949772773082",Caída de ocupante en Transporte Público,2578.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
6,https://www.zaragoza.es/sede/servicio/transpor...,2014,ATROPELLO,,"PIGNATELLI, RAMON VIA",,"-0.8880337913721866,41.633353667694024",PEATÓN cruza calz SIN PREFER. fuera de paso,2606.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
7,https://www.zaragoza.es/sede/servicio/transpor...,2014,CAIDA SOBRE CALZADA,,"ALIERTA, AV. CESAREO","AULA, LUIS","-0.8708838775078237,41.6390382112928",INVADIR otro carril en el mismo sentido de cir...,2583.0,2014-10-24T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...
8,https://www.zaragoza.es/sede/servicio/transpor...,2014,COLIS. MARCHA ATRÁS,,"CERBUNA, PEDRO",,"-0.8970649943808023,41.64083344974765",PERDIDA del control por FALTA de ATENCIÓN,2556.0,2014-10-24T00:00:00Z,True,False,BUEN ESTADO,,BUEN ESTADO,,,https://www.zaragoza.es/sede/servicio/transpor...
9,https://www.zaragoza.es/sede/servicio/transpor...,2013,COLISIÓN LATERAL,,ASALTO,"COCCI, JORGE","-0.8718525605769747,41.64904657717317",INVADIR otro carril en el mismo sentido de cir...,4657.0,2013-12-20T00:00:00Z,False,False,BUEN ESTADO,,BUEN ESTADO,,https://www.zaragoza.es/sede/servicio/transpor...,https://www.zaragoza.es/sede/servicio/transpor...


## Explorar datos

En este punto del ejercicio, se realizó una exploración con diferentes funciones para imprimer los resultados que se requerian. En primer lugar, la función `df.columns` muestra los nomnbres de las columnas de la estructura de datos `DataFrame`

In [7]:
df.columns

Index(['id', 'year', 'type', 'accidentType', 'firstAddress', 'secondAddress',
       'geometry', 'reason', 'area', 'creationDate', 'daniosMateriales',
       'falloMecanico', 'estadoPavimento', 'tipoEstadoPavimento',
       'estadoAtmosfera', 'tipoEstadoAtmosfera', 'afectado', 'vehiculo'],
      dtype='object')

Con la función `df['geometry']` se solicita que se cree una lista de la columna Geometry utilizando los corchetes y el nombre de estos valores con la comilla sencilla. Después de ejecutarla, los datos se imprimen sepados por comas. 

In [8]:
df['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
5      -0.8691088511672924,41.65949772773082
6     -0.8880337913721866,41.633353667694024
7       -0.8708838775078237,41.6390382112928
8      -0.8970649943808023,41.64083344974765
9      -0.8718525605769747,41.64904657717317
10     -0.8964627561577849,41.64322365075108
11     -0.8778095796207178,41.68753087470739
12    -0.8812157329722801,41.661646612715046
13      -0.8762000299022707,41.6454384961757
14     -0.9089013552408617,41.65543768899759
15     -0.9004729973337304,41.65180346604993
16     -0.8917562993466011,41.65233828238132
17      -0.888856043735591,41.65040494617356
18    -0.8629911318784169,41.645335650478316
19    -0.8870207060655807,41.609992514227066
Name: geometry, dtype: object

La función `df.info()` se utilizó para obtener un resumen de los datos mostrando el total de columnas en el `DataFrame` y el tipo de dato que es, es decir, *bool, float 64, int 64, object*.

In [9]:
df.info ()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 18 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   id                   20 non-null     object 
 1   year                 20 non-null     int64  
 2   type                 20 non-null     object 
 3   accidentType         0 non-null      float64
 4   firstAddress         20 non-null     object 
 5   secondAddress        11 non-null     object 
 6   geometry             20 non-null     object 
 7   reason               20 non-null     object 
 8   area                 18 non-null     float64
 9   creationDate         20 non-null     object 
 10  daniosMateriales     20 non-null     bool   
 11  falloMecanico        20 non-null     bool   
 12  estadoPavimento      20 non-null     object 
 13  tipoEstadoPavimento  0 non-null      float64
 14  estadoAtmosfera      20 non-null     object 
 15  tipoEstadoAtmosfera  0 non-null      float

Con respecto a la función `df.describe()` tiene como objetivo mostrar los datos estadísticos del `DataFrame`.

In [10]:
df.describe ()

Unnamed: 0,year,accidentType,area,tipoEstadoPavimento,tipoEstadoAtmosfera
count,20.0,0.0,18.0,0.0,0.0
mean,2013.45,,3234.0,,
std,0.510418,,1551.515843,,
min,2013.0,,18.0,,
25%,2013.0,,2557.0,,
50%,2013.0,,2602.0,,
75%,2014.0,,4666.25,,
max,2014.0,,4780.0,,


La función `df['type'].unique()`imprime el tipo de accidente de tránsito que se encuentra en la url de donde estamos extrayendo la información.

In [11]:
df['type'].unique()

array(['SALIDA CALZADA', 'COLISIÓN ALCANCE', 'COLIS FRONTOLATERAL',
       'OTRAS', 'ATROPELLO', 'CAIDA SOBRE CALZADA', 'COLIS. MARCHA ATRÁS',
       'COLISIÓN LATERAL'], dtype=object)

In [12]:
df.columns

Index(['id', 'year', 'type', 'accidentType', 'firstAddress', 'secondAddress',
       'geometry', 'reason', 'area', 'creationDate', 'daniosMateriales',
       'falloMecanico', 'estadoPavimento', 'tipoEstadoPavimento',
       'estadoAtmosfera', 'tipoEstadoAtmosfera', 'afectado', 'vehiculo'],
      dtype='object')

In [13]:
df['geometry']

0     -0.8818527060979306,41.649027473051156
1     -0.8645810716721081,41.661585829868585
2      -0.887776415002892,41.666992622958105
3      -0.8825260453930127,41.62957498750602
4        -0.908314757720389,41.6562121210704
5      -0.8691088511672924,41.65949772773082
6     -0.8880337913721866,41.633353667694024
7       -0.8708838775078237,41.6390382112928
8      -0.8970649943808023,41.64083344974765
9      -0.8718525605769747,41.64904657717317
10     -0.8964627561577849,41.64322365075108
11     -0.8778095796207178,41.68753087470739
12    -0.8812157329722801,41.661646612715046
13      -0.8762000299022707,41.6454384961757
14     -0.9089013552408617,41.65543768899759
15     -0.9004729973337304,41.65180346604993
16     -0.8917562993466011,41.65233828238132
17      -0.888856043735591,41.65040494617356
18    -0.8629911318784169,41.645335650478316
19    -0.8870207060655807,41.609992514227066
Name: geometry, dtype: object

Después, con la función 'type(df['geometry'][0]) se mostrará la primera celda de la columna geometry con el tipo de dato que contiene. En este caso, fue str, es decir, una secuencia inmutable de caracteres Unicode.

In [14]:
type(df['geometry'][0])

str

## Separación de valores

Para separar valores se uso la función `df['geometry'][0].split(',')`, siendo `Split`la orden encargada de desintegrar los valores en dos partes mediante una coma. En este caso,  se realizará la divisón de la primera celda de la columna geometry.

In [15]:
df['geometry'][0].split(',')

['-0.8818527060979306', '41.649027473051156']

Entre tanto, con la función `point = df['geometry'][0].split(',')`, se creará un punto de esta estructura de datos que tiene longitud y latitud. 

In [16]:
point = df['geometry'][0].split(',')
point

['-0.8818527060979306', '41.649027473051156']

Al ejecutar la orden `type(point)` se puede comprobar que se realizó la separación y que se ha creado una lista derivado de la cadena de caracteres. 

In [17]:
type(point)

list

Luego, se crearon dos listas con el uso de corchetes: `longitudes = []` y `latitudes = []`que se encuentran vacías, por el momento, pues carecen de algún dato.

In [18]:
longitudes = []
latitudes = []

In [19]:
longitudes

[]

In [20]:
type(longitudes)

list

## Generar bluce `for`

Para rellenar la lista `longitudes = []`, se creó el bluce `for para i (input)`, que se refiere a cada uno de los elementos que aparecen en la columna geometry del `DataFrame`(`df`). Luego, con la orden `punto_coord = i.split (',')` se uso para separar los datos de la columna por comas. Con el += y el número 1 entre corchetes, se buscó imprimir el segundo elemento de la lista, los cuales serán decimales tras establecer la orden `float`. 
Finalmente, al introducir la orden `longitudes`, el programa mostró esta lista con los detalles establecidos. 

In [21]:
for i in df['geometry']:
    punto_coord = i.split (',')
    longitudes += [float(punto_coord[1])]
longitudes

[41.649027473051156,
 41.661585829868585,
 41.666992622958105,
 41.62957498750602,
 41.6562121210704,
 41.65949772773082,
 41.633353667694024,
 41.6390382112928,
 41.64083344974765,
 41.64904657717317,
 41.64322365075108,
 41.68753087470739,
 41.661646612715046,
 41.6454384961757,
 41.65543768899759,
 41.65180346604993,
 41.65233828238132,
 41.65040494617356,
 41.645335650478316,
 41.609992514227066]

In [22]:
latitudes

[]

In [23]:
type(latitudes)

list

Se llevaron a cabo los mismo pasos para imprimir la lista `latitudes = []`. Sin embargo, entre los corchetes se colocó un 0 en lugar de un 1. 

In [24]:
for i in df['geometry']:
    punto_coord = i.split (',')
    latitudes += [float(punto_coord[0])]
latitudes

[-0.8818527060979306,
 -0.8645810716721081,
 -0.887776415002892,
 -0.8825260453930127,
 -0.908314757720389,
 -0.8691088511672924,
 -0.8880337913721866,
 -0.8708838775078237,
 -0.8970649943808023,
 -0.8718525605769747,
 -0.8964627561577849,
 -0.8778095796207178,
 -0.8812157329722801,
 -0.8762000299022707,
 -0.9089013552408617,
 -0.9004729973337304,
 -0.8917562993466011,
 -0.888856043735591,
 -0.8629911318784169,
 -0.8870207060655807]

In [25]:
df_coord = pd.DataFrame({'long':longitudes,'lat':latitudes})
df_coord

Unnamed: 0,long,lat
0,41.649027,-0.881853
1,41.661586,-0.864581
2,41.666993,-0.887776
3,41.629575,-0.882526
4,41.656212,-0.908315
5,41.659498,-0.869109
6,41.633354,-0.888034
7,41.639038,-0.870884
8,41.640833,-0.897065
9,41.649047,-0.871853


## Creación DataFrame

Se creará la tabla con los tipos de accidente y la latitud y logitud en donde se presentó este hecho, es decir, el `DataFrame`. A esta estructura de valores se le designó el nombre `df_coord`. Con la función `pd.concat([df['type'],df_coord],axis=1)` se imprimirán los tipos de accidente y con el axis=1, estos datos se ubicarán a la derecha creando una nueva columna. 

In [26]:
df_accidentes = pd.concat([df['type'],df_coord],axis=1)
df_accidentes 

Unnamed: 0,type,long,lat
0,SALIDA CALZADA,41.649027,-0.881853
1,COLISIÓN ALCANCE,41.661586,-0.864581
2,COLISIÓN ALCANCE,41.666993,-0.887776
3,COLIS FRONTOLATERAL,41.629575,-0.882526
4,SALIDA CALZADA,41.656212,-0.908315
5,OTRAS,41.659498,-0.869109
6,ATROPELLO,41.633354,-0.888034
7,CAIDA SOBRE CALZADA,41.639038,-0.870884
8,COLIS. MARCHA ATRÁS,41.640833,-0.897065
9,COLISIÓN LATERAL,41.649047,-0.871853


Luego, se estableció un marcador con la función `folium.Marker` que permite crear un punto en el mapa con las coordenadas de Zaragoza. A su vez, cuando se realice el clic en este marcador, aparecerá un `popup` con el mensaje **"¡Hola, Zaragoza!"**. 
Además, con la orden `mapa.add_child` se asignaron al mapa los cambios modificados en el marcador. 
Con la palabra `mapa`, se imprimió el gráfico con estas especificaciones. 

In [27]:
marcador = folium.Marker(coords_zrgz, popup="¡Hola, Zaragoza!")
mapa = mapa.add_child(marcador)
mapa

Finalmente, con la función `iterrows`, realizamos un mapa con cada uno de los puntos que tiene la tabla. Esta función significa que se itera por cada fila, es decir, que da la orden de hacer lo mismo por cada una de las filas.
Además también ejecutará esto con los `DataFrame` creados anteriormente.

In [28]:
for indice, fila in df_accidentes.iterrows():
    marcador = folium.Marker([fila['lat'],fila['long']],\
                             popup=fila['type'])
    mapa.add_child(marcador)
mapa