# Ejercicio de geocodificación de direcciones postales

En el siguiente cuaderno se mostrará un ejemplo sencillo para geocodificar direcciones postales de establecimientos de Cantabria con Google Maps. Para ello, se utilizarán las siguientes bibliotecas de Python (cuya dependencia habrá que satisfacer previamente instalándolas):

- `pandas`: [Python Data Anaylsis Library](https://pandas.pydata.org/).
- `googlemaps`: [Python client library for Google Maps API Web Services](https://github.com/googlemaps/google-maps-services-python). 

Si es necesario instalar el paquete en el cuaderno, puede hacerse ejecutando el comando: `!pip install googlemaps`, por ejemplo.

## Importación del dataset

En primer lugar, es necesario importar el dataset o conjunto de datos de prueba en una estructura de tipo `dataframe` de pandas. Para ello, se utilizará el método `read_csv`.

La URL que contiene el dataset es la siguiente: [https://gist.githubusercontent.com/predicador37/b062c7b441831103b49d9065913dc52f/raw](https://gist.githubusercontent.com/predicador37/b062c7b441831103b49d9065913dc52f/raw)

Hay que prestar atención a las siguientes peculiaridades:

- No es deseable tratar el código postal como un número
- Tampoco es deseable tratar los elementos vacíos como un nan

Una vez leído, es conveniente explorar el dataset con head(), por ejemplo.


## Instanciación de un cliente Google Maps

Usando la biblioteca `googlemaps`, es posible instanciar un cliente con una clave de API (API key) de geocodificación dada. Para ello, previamente será necesario que el alumno genere una clave de este tipo en Google Maps. El proceso de obtención de clave está bastante automatizado y documentado en [este enlace](https://developers.google.com/maps/documentation/javascript/get-api-key?hl=ES).

Una vez se disponga de una clave, se instanciará el cliente.



## Geocodificación de las direcciones postales

### Ejemplo y exploración

A continuación se geocodificará la primera dirección incluida en el dataframe con objeto de inspeccionar la salida ofrecida por Google Maps y la biblioteca utilizada.

Para obtener mejores resultados, es conveniente pasar a Google Maps la dirección como una cadena de texto y dejar que sean sus propios parsers quienes la analicen. Por ello, será necesario generar una cadena con la dirección completa a partir de las columnas del dataframe de la siguiente manera:

        TIPO_VÍA NOMBRE_VÍA PORTAL, CÓDIGO_POSTAL LOCALIDAD 
        
**Importante**: es necesario respetar los espacios y las comas tal y como se disponen en la estructura anterior.

Muestre en el cuaderno el resultado de la concatenación.

A continuación, es posible llamar al método `geocode` del cliente instanciado previamente y pasarle como parámetro la dirección confeccionada.

Explore el resultado devuelto por la biblioteca y su tipo de datos.

Como se puede observar, Google puede devolver más de un resultado de geocodificación. En este caso, sólo interesará el primero. Para generar la salida final del ejercicio, se utilizará una lista de listas (cada una a modo de fila del dataframe resultado). Cada elemento lista asociado a una dirección postal contendrá los siguientes campos devueltos en la estructura de datos anterior:

        formatted_address, latitude, longitude
        
Extraiga dichos elementos de la estructura y añádalos a una lista. **Tenga en cuenta que Google puede devolver una estructura vacía...** En este caso, incluya la dirección formateada previamente y la latitud y longitud en blanco (vacías).

Muestre el resultado geocodificado con la estructura indicada como ejemplo.

### Geocodificación de todo el conjunto de datos

Una vez realizada una prueba con una dirección, aplique este proceso a todo el conjunto de direcciones del dataframe. Para ello, itere sobre cada fila y añada cada resultado en una variable de tipo lista llamada `results`.

Una vez finalizadas las iteraciones y completada la lista, genere un dataframe a partir de dicha lista usando como columnas las siguientes etiquetas:

        'address', 'latitude', 'longitude'
        
Explore el dataframe resultante con `head()`

## Volcado del resultado

Finalmente, vuelque el contenido del dataframe a un archivo CSV (por ejemplo, `results.csv`) de manera que el índice aparezca como una columna etiquetada como 'id'.