# Geopandas

In [None]:
import geopandas as gdp
import pandas as pd
import os
import zipfile
import matplotlib.pyplot as plt

## Leyendo capas vectoriales

Shapefile es por defecto el formato que lee datos usando `geopandas`. Para leer un shapefile, simplemente se usa el método `read_file` de `geopandas` y se le pasa la ruta del archivo como argumento. El resultado es un GeoDataFrame.

Observa que aunque el ``shapefile`` consiste en varios archivos, solo es necesario especificar el nombre del archivo con la extensión ``.shp``. El resto de archivos son leídos automáticamente por `geopandas`.

Para checar el contenido del shapefile, se puede usar el método `head()` de `pandas` para ver las primeras filas del GeoDataFrame. También se puede usar el método `plot()` de `geopandas` para visualizar los datos en un mapa.

También es posible visualizar la geometría de los datos usando el método `plot()` de `geopandas`. Este método genera un gráfico de la geometría de los datos, lo que permite ver la distribución espacial de los mismos. El método `plot()` también permite personalizar el gráfico, como cambiar el color y el tamaño de los puntos o líneas, agregar etiquetas, etc.

Para visualizar las columnas del GeoDataFrame, se puede usar el método `columns` de `pandas`. Este método devuelve una lista con los nombres de las columnas del GeoDataFrame. También se puede usar el método `info()` de `pandas` para obtener información más detallada sobre las columnas, como el tipo de datos y la cantidad de valores no nulos en cada columna.

Algunas veces no será posible visualizar todas los nombres de las columnas, pero podemos aplicar lo siguiente para ver los nombres completos:

Aquí vamos a filtrar las columnas que nos interesan.

Una buena practica consiste en nombrar las columnas sin caracteres especiales, espacios o mayúsculas. Se recomienda usar el ``_snake_case_`` para los nombres de las columnas. Esto facilita el manejo de los datos y evita problemas al trabajar con ellos en Python. Por ejemplo, en lugar de usar "Nombre de la columna", se puede usar "nombre_de_la_columna". Esto hace que el código sea más legible y fácil de entender.

## Recordando Shapely

Como podemos observar en la celda anterior, la columna `geometry` contiene objetos de tipo `shapely`. Estos objetos son los que nos permiten manipular y analizar la geometría de los datos espaciales. Por ejemplo, podemos calcular el área de un polígono, la distancia entre dos puntos, o verificar si un punto está dentro de un polígono.

Es muy sencillo generar operaciones espaciales. Por ejemplo, calcular el área de toda una GeoSerie. Para ello, se puede usar el método `area` de `shapely`.

### Sistemas de coordenadas de referencia (CRS)


Recordemos que siempre hay que saber en qué sistema de coordenadas estamos trabajando. Para ello, `geopandas` tiene un atributo llamado `crs` que nos permite conocer el sistema de coordenadas de referencia (CRS) de los datos. Este atributo devuelve un objeto `pyproj.CRS` que contiene información sobre el CRS, como el nombre, el código EPSG, y la proyección utilizada.

## Generando una capa vectorial

## Agrupaciones 

### (A) groupby

`groupby()` no solo permite agrupar registros según un atributo, sino que también se puede combinar con funciones de agregación para realizar cálculos específicos. Por ejemplo, podemos agrupar por el atributo _municipio_ y calcular la población total correspondiente a cada uno.

Esta herramienta agrupa filas en función de uno o más valores y permite aplicar funciones como ``sum``, ``mean``, ``count``, entre otras.

### (B) pivot

`pivot()` reorganiza los datos sin aplicar funciones de agregación. Usa columnas como índices, columnas, y valores.

### (C) pivot_table

`pivot_table()` como ``pivot()`` pero con agregación automática, por si hay duplicados.

Si el componente geoespacial no es relevante, es decir, quiero construir una tabla de datos, puedo guardar esta información que extraje de un archivo original _shapefile_ en un archivo _csv_ o _xlsx_. Para ello, se puede usar el método `to_csv()` o `to_excel()` de `pandas`. Estos métodos permiten guardar el GeoDataFrame en un archivo CSV o Excel, respectivamente. También se pueden especificar opciones adicionales, como el separador, la codificación, y si se quiere incluir el índice o no.