<a href="https://colab.research.google.com/github/marianobonelli/Introduccion_a_Python_2024/blob/main/Introduccion_a_Python_2024_5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introducción a la programación y análisis de datos con Python orientado a la producción agropecuaria

[![Cronograma](https://img.shields.io/badge/-Cronograma-blue?style=flat&logo=google-docs&logoColor=white)](https://docs.google.com/document/d/1RkiQrAyWAuJglmTdKCfa4QQ4JYHh0Klg6iRRzxSv8cc/edit?usp=sharing) [![Repositorio de GitHub](https://img.shields.io/badge/-Repositorio%20de%20GitHub-blue?style=flat&logo=github&logoColor=white)](https://github.com/marianobonelli/Introduccion_a_Python_2024)




**Clase 5: Jueves 5 de Septiembre**


Introducción a librerías - Parte I:

* Uso de matplotlib y seaborn para visualizar datos.

---

# Matplotlib

[<img src="https://matplotlib.org/_static/logo_dark.svg" width=200px>](https://matplotlib.org/stable/gallery/index)



<img src="https://matplotlib.org/stable/_images/sphx_glr_barchart_thumb.png" width=200px><img src="https://matplotlib.org/stable/_images/sphx_glr_csd_demo_thumb.png" width=200px><img src="https://matplotlib.org/stable/_images/sphx_glr_scatter_demo2_thumb.png" width=200px><img src="https://matplotlib.org/stable/_images/sphx_glr_step_demo_thumb.png" width=200px><img src="https://matplotlib.org/stable/_images/sphx_glr_multicolored_line_thumb.png" width=200px>

[Matplotlib](https://matplotlib.org/) (**Mat**-h **Plot** **Lib**rary)

Matplotlib es una poderosa librería de Python para la visualización de datos, ampliamente utilizada para crear gráficos estáticos, animados e interactivos. Su flexibilidad la convierte en una herramienta esencial para quienes buscan realizar visualizaciones detalladas y personalizadas. Es considerada una biblioteca de bajo nivel para la visualización de datos.


### Características principales

* ***Abstracción detallada:*** Matplotlib permite un control minucioso sobre prácticamente todos los aspectos de un gráfico, desde el tamaño del lienzo y el espaciado, hasta los colores, tipos de líneas y escalas de los ejes. Esta capacidad de personalización es ideal para crear gráficos que se ajusten exactamente a las necesidades del usuario.

* ***Flexibilidad:*** Como una biblioteca de bajo nivel, Matplotlib ofrece la posibilidad de construir gráficos muy específicos y adaptados. Sin embargo, esta flexibilidad suele requerir una mayor cantidad de código, lo que implica un esfuerzo adicional en su desarrollo.

* ***Curva de Aprendizaje:*** Debido a su naturaleza detallada, Matplotlib puede presentar una curva de aprendizaje más pronunciada, especialmente para usuarios novatos o aquellos que no requieren un alto grado de personalización en sus gráficos.

* ***Uso:*** Matplotlib es la elección perfecta cuando se necesita desarrollar gráficos altamente específicos o cuando se trabaja con visualizaciones que no están cubiertas por bibliotecas de más alto nivel.

### Estructura del código:

* ***Importación de la Biblioteca:***  Para comenzar a trabajar con Matplotlib, se importa la librería utilizando import matplotlib.pyplot as plt.


* ***Creación de la Figura y los Ejes:*** Se emplea plt.subplots() para crear una figura y uno o varios ejes (subgráficos). Por ejemplo, fig, axes = plt.subplots(2, 2, figsize=(12, 10)) genera una figura con 4 subgráficos organizados en 2 filas y 2 columnas.

* ***Dibujar en los Ejes:*** Para cada subgráfico, se utilizan métodos como scatter() para gráficos de dispersión o hist() para histogramas. Los ejes específicos en los que se dibuja se especifican, por ejemplo, axes[0, 0].scatter(...).

* ***Personalización:*** Se pueden añadir títulos, etiquetas a los ejes, modificar colores, entre otras personalizaciones.

* ***Visualización:*** Finalmente, el gráfico se muestra en pantalla utilizando plt.show().


## [Matplotlib cheatsheets and handouts](https://matplotlib.org/cheatsheets/)



[<img src="https://matplotlib.org/cheatsheets/_images/cheatsheets-1.png" width=300px>](https://matplotlib.org/cheatsheets/_images/cheatsheets-1.png) [<img src="https://matplotlib.org/cheatsheets/_images/cheatsheets-2.png" width=300px>](https://matplotlib.org/cheatsheets/_images/cheatsheets-2.png)

In [None]:
import requests
import pandas as pd

In [None]:
# Definimos la función para extraer datos de Nasa Power
def get_climate_data_nasa_power(parameters, longitud, latitud, start, end, format='json'):

  response = requests.get(f"https://power.larc.nasa.gov/api/temporal/daily/point?parameters={parameters}&community=RE&longitude={longitud}&latitude={latitud}&start={start}&end={end}&format={format}")

  # Extraer los datos en formato de diccionario de la respuesta
  data = response.json()

  return data

In [None]:
parametros = 'T2M,T2M_MAX,T2M_MIN,WS2M,PRECTOTCORR,RH2M'
lon = -64.29
lat = -33.1
inicio = 20240101 # AAAAMMDD
fin = 20240115 # AAAAMMDD

# Llamado a la función
data = get_climate_data_nasa_power(parameters=parametros,
                                   longitud=lon,
                                   latitud=lat,
                                   start=inicio,
                                   end=fin)

# Extraer la sección relevante del diccionario para crear el DataFrame
df = pd.DataFrame(data['properties']['parameter'])

df.head()

In [None]:
#Lograr las fechas sean una columna en lugar del índice
df = df.reset_index() #Reset del indice y genera una nueva columna "indice"

# Renombrar la columna de fechas
df.rename(columns={
    'index' : 'Fecha',
    'T2M' : 'temperatura',
    'T2M_MAX' : 'temperatura_max',
    'T2M_MIN' : 'temperatura_min',
    'WS2M' : 'velocidad_viento',
    'PRECTOTCORR' : 'precipitaciones',
    'RH2M' : 'humedad_relativa'
    }, inplace=True)

# Convertir la fecha al formato Día-Mes-Año
df['Fecha'] = pd.to_datetime(df['Fecha'], format='%Y%m%d').dt.strftime('%d-%m-%Y')

# Mostrar el DataFrame
df.head()

##Importación de la biblioteca

In [None]:
import matplotlib.pyplot as plt

##Crear la figura y los ejes

Ahora vamos a crear el gráfico. Para esto, usamos la función plt.subplots(), que crea un lienzo y un "eje" donde dibujar.

* plt.subplots() crea una figura (fig) y un eje (ax).

* figsize=(10, 6) define el tamaño del gráfico, donde 10 representa el ancho y 6 el alto. Esto se puede ajustar según la necesidad.



In [None]:
fig, ax = plt.subplots(figsize=(10, 6))

## Grafico de evolucion de la temperatura

In [None]:
# Crear la figura y los ejes
fig, ax = plt.subplots(figsize=(10, 6))

# Dibujar la línea de temperatura
ax.plot(df['Fecha'],
        df['temperatura'], # Dibuja una línea usando los datos en el eje x (df['Fecha']) y el eje y (df['temperatura'])
        color='blue', # Se elige el color azul para la línea
        label='Temperatura') # Asigna un nombre a la línea que aparecerá en la leyenda

# Añadir título y etiquetas
ax.set_title('Evolución de la Temperatura', fontsize=16) # Asigna el título del gráfico ("Evolución de la Temperatura")
ax.set_xlabel('Fecha', fontsize=12) # Etiqueta para el eje x ("Fecha")
ax.set_ylabel('Temperatura (°C)', fontsize=12)  # Etiqueta para el eje y ("Temperatura (°C)"), y el parámetro fontsize ajusta el tamaño de la fuente
plt.xticks(rotation=45) # Rota las etiquetas de los valores del eje x (las fechas) 45 grados para que no se superpongan y se vean más claramente.
ax.legend() # Muestra la leyenda en el gráfico, usando el label definido en la línea del gráfico

# Mostrar el gráfico
plt.show() # Muestra la leyenda en el gráfico, usando el label definido en la línea del gráfico

## Gráfico de barras: Comparar precipitaciones por fecha.


In [None]:
# Crear la figura y los ejes
fig, ax = plt.subplots(figsize=(10, 6))

# Dibujar el gráfico de barras
ax.bar(df['Fecha'],
       df['precipitaciones'],
       color='green')

# Añadir título y etiquetas
ax.set_title('Precipitaciones Diarias', fontsize=16)
ax.set_xlabel('Fecha', fontsize=12)
ax.set_ylabel('Precipitaciones (mm)', fontsize=12)
plt.xticks(rotation=45) # Rotar las etiquetas del eje x

# Mostrar el gráfico
plt.show()

## Histograma: Distribución de la temperatura máxima.

In [None]:
# Crear la figura y los ejes
fig, ax = plt.subplots(figsize=(10, 6))

# Dibujar el histograma
ax.hist(df['temperatura_max'],
        bins=5,
        color='orange',
        edgecolor='black')

# Añadir título y etiquetas
ax.set_title('Distribución de la Temperatura Máxima', fontsize=16)
ax.set_xlabel('Temperatura Máxima (°C)', fontsize=12)
ax.set_ylabel('Frecuencia', fontsize=12)

# Mostrar el gráfico
plt.show()

## Gráfico de dispersión (scatter plot): Relación entre la velocidad del viento y la humedad relativa.

In [None]:
# Crear la figura y los ejes
fig, ax = plt.subplots(figsize=(10, 6))

# Dibujar el gráfico de dispersión
ax.scatter(df['velocidad_viento'],
           df['humedad_relativa'],
           color='red')

# Añadir título y etiquetas
ax.set_title('Velocidad del Viento vs. Humedad Relativa', fontsize=16)
ax.set_xlabel('Velocidad del Viento (m/s)', fontsize=12)
ax.set_ylabel('Humedad Relativa (%)', fontsize=12)

# Mostrar el gráfico
plt.show()

## Múltiples gráficos en una misma figura:

`plt.subplots()` te permite crear una cuadrícula de gráficos dentro de una figura. Al especificar el número de filas y columnas, puedes crear múltiples "ejes" o gráficos en la misma figura.

Ejemplo Básico: Crear una Figura con Múltiples Gráficos
Supongamos que deseas crear una figura con dos gráficos (uno al lado del otro):

Configurar la Cuadrícula de Gráficos Utilizas plt.subplots(nrows, ncols) donde nrows es el número de filas y ncols es el número de columnas.

```python
# Crear una figura con 1 fila y 2 columnas de gráficos
fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(12, 6))
```
Esto crea una figura de 12x6 pulgadas con dos gráficos dispuestos en una sola fila.

Dibujar en los Ejes Cada elemento de ax es un gráfico independiente. Puedes acceder a cada uno usando `ax[0]`, `ax[1]`, etc., dependiendo de su posición.


In [None]:
# Crear una figura con 2 filas y 2 columnas de gráficos
fig, ax = plt.subplots(nrows=2, ncols=2, figsize=(12, 8))

################################################################################
# Primer gráfico: Temperatura media

ax[0, 0].plot(df['Fecha'],
              df['temperatura'],
              label='Temperatura Media',
              color='orange')

ax[0, 0].set_title('Temperatura Media')
ax[0, 0].set_xlabel('Fecha')
ax[0, 0].set_ylabel('Temperatura (°C)')
ax[0, 0].legend()
ax[0, 0].tick_params(axis='x', rotation=45)

################################################################################
# Segundo gráfico: Temperatura máxima y mínima

ax[0, 1].plot(df['Fecha'],
              df['temperatura_max'],
              label='Temperatura Máxima',
              color='red')

ax[0, 1].plot(df['Fecha'],
              df['temperatura_min'],
              label='Temperatura Mínima',
              color='blue')

ax[0, 1].set_title('Temperatura Máxima y Mínima')
ax[0, 1].set_xlabel('Fecha')
ax[0, 1].set_ylabel('Temperatura (°C)')
ax[0, 1].legend()
ax[0, 1].tick_params(axis='x', rotation=45)

################################################################################
# Tercer gráfico: Velocidad del viento

ax[1, 0].plot(df['Fecha'],
              df['velocidad_viento'],
              label='Velocidad del Viento',
              color='green')

ax[1, 0].set_title('Velocidad del Viento')
ax[1, 0].set_xlabel('Fecha')
ax[1, 0].set_ylabel('Velocidad (m/s)')
ax[1, 0].legend()
ax[1, 0].tick_params(axis='x', rotation=45)

################################################################################
# Cuarto gráfico: Precipitaciones y Humedad Relativa

ax[1, 1].plot(df['Fecha'],
              df['precipitaciones'],
              label='Precipitaciones (mm)',
              color='purple')

ax[1, 1].plot(df['Fecha'],
              df['humedad_relativa'],
              label='Humedad Relativa (%)',
              color='cyan')

ax[1, 1].set_title('Precipitaciones y Humedad Relativa')
ax[1, 1].set_xlabel('Fecha')
ax[1, 1].set_ylabel('Valor')
ax[1, 1].legend()
ax[1, 1].tick_params(axis='x', rotation=45)

################################################################################

# Ajustar el diseño para que los gráficos no se superpongan
plt.tight_layout()

# Mostrar la figura
plt.show()

# Seaborn

[<img src="https://seaborn.pydata.org/_static/logo-wide-lightbg.svg" width=200px>](https://seaborn.pydata.org/examples/index.html)

<img src="https://seaborn.pydata.org/_images/scatterplot_matrix_thumb.png" width=200px><img src="https://seaborn.pydata.org/_images/errorband_lineplots_thumb.png" width=200px><img src="https://seaborn.pydata.org/_images/scatterplot_sizes_thumb.png" width=200px><img src="https://seaborn.pydata.org/_images/horizontal_boxplot_thumb.png" width=200px><img src="https://seaborn.pydata.org/_images/regression_marginals_thumb.png" width=200px>

[Seaborn](https://seaborn.pydata.org/#)

Seaborn es una biblioteca de alto nivel diseñada para la creación de gráficos estadísticos en Python. Construida sobre Matplotlib, Seaborn ofrece una interfaz simplificada que facilita la creación de visualizaciones complejas y estéticamente atractivas con un enfoque en el análisis estadístico.


### Características
* ***Abstracción simplificada:*** Seaborn se basa en Matplotlib pero ofrece una capa de abstracción más alta, lo que permite a los usuarios crear gráficos estadísticos comunes de manera más sencilla. Esto hace que sea ideal para quienes buscan generar visualizaciones informativas sin necesidad de un control exhaustivo sobre cada detalle.

* ***Facilidad de uso:*** Con Seaborn, es posible producir gráficos complejos y visualmente atractivos con menos líneas de código. La biblioteca incluye una variedad de tipos de gráficos predefinidos y estilos que están optimizados para la claridad y la estética.

* ***Funcionalidades estadísticas integradas:*** Seaborn incorpora capacidades estadísticas avanzadas directamente en sus gráficos, como la posibilidad de realizar regresiones lineales o visualizar distribuciones de datos de forma nativa. Esto facilita el análisis exploratorio de datos al permitir una integración fluida de estadísticas y visualización.

* ***Uso:***: Seaborn es especialmente adecuado para análisis exploratorios de datos, donde es crucial generar gráficos estadísticos informativos y atractivos de manera rápida y eficiente.


### Estructura del código

* ***Importación de la biblioteca:*** Seaborn se importa con import seaborn as sns.

* ***Cargar datos:*** Seaborn trabaja directamente con DataFrames de Pandas. Por ejemplo, iris = sns.load_dataset("iris") carga un conjunto de datos directamente en un DataFrame.

* ***Creación de gráficos:*** Seaborn ofrece funciones de alto nivel para crear diversos tipos de gráficos. Por ejemplo, sns.pairplot(iris, hue='species') genera una matriz de gráficos para cada combinación de variables en el DataFrame, coloreadas según una categoría específica.

* ***Personalización y estilo:*** Seaborn aplica automáticamente estilos y temas que mejoran la apariencia de los gráficos, con opciones disponibles para personalizar estos aspectos según las necesidades del usuario.

* ***Visualización:*** Aunque la visualización suele ocurrir automáticamente al llamar a una función de gráficos en Seaborn, se recomienda utilizar plt.show() para asegurar que el gráfico se renderice correctamente en todos los entornos.


## [Seaborn cheatsheets and handouts](https://www.paradigmadigital.com/assets/cms/cheat_sheet_pandas_seaborn_49f1c67732.pdf)

###Comparación con Matplotlib

Mientras que Matplotlib ofrece un control total sobre cada aspecto de un gráfico a cambio de una mayor complejidad y cantidad de código, Seaborn simplifica la creación de visualizaciones comunes, permitiendo a los usuarios concentrarse en el análisis y la interpretación de datos.

##Importación de la biblioteca

In [None]:
import seaborn as sns

##Gráfico de dispersión

In [None]:
plt.figure(figsize=(10, 6))

sns.scatterplot(x='temperatura',
                y='precipitaciones',
                data=df,
                hue='velocidad_viento', # Este parámetro se usa para añadir una dimensión adicional al gráfico mediante el color, en este caso velocidad del viento
                palette='viridis'
                )

plt.title('Temperatura vs Precipitaciones')
plt.xlabel('Temperatura (°C)')
plt.ylabel('Precipitaciones (mm)')
plt.legend(title='Velocidad del Viento')

plt.show()

##Gráfico de líneas

In [None]:
plt.figure(figsize=(10, 6))

sns.lineplot(x='Fecha',
             y='temperatura',
             data=df,
             marker='o',
             color='b',
             label='Temperatura')

sns.lineplot(x='Fecha',
             y='temperatura_max',
             data=df,
             marker='o',
             color='r',
             label='Temperatura Max')

sns.lineplot(x='Fecha',
             y='temperatura_min',
             data=df,
             marker='o',
             color='g',
             label='Temperatura Min')

plt.title('Temperaturas a lo Largo del Tiempo')
plt.xlabel('Fecha')
plt.ylabel('Temperatura (°C)')
plt.legend()
plt.xticks(rotation=45)

plt.show()

##Histograma

In [None]:
plt.figure(figsize=(10, 6))

sns.histplot(df['precipitaciones'],
             bins=5, # Define el número de intervalos (bins) en el histograma. En este caso, el rango de los datos se divide en 5 intervalos o barras
             kde=True, # kde=True:La KDE es una técnica de estimación de la densidad de probabilidad que suaviza el histograma para mostrar la distribución subyacente de los datos. Esto se representa con una línea suavizada sobre el histograma.
             color='blue'
             )

plt.title('Distribución de Precipitaciones')
plt.xlabel('Precipitaciones (mm)')
plt.ylabel('Frecuencia')

plt.show()

##Pairplot

In [None]:
plt.figure(figsize=(12, 8))

sns.pairplot(df[['temperatura', 'temperatura_max', 'temperatura_min', 'precipitaciones']],
             diag_kind='kde',
             hue='temperatura')

plt.show()



---



# Minidesafíos

A partir de la función de llamada a la API de NASA POWER obtener los datos de precipitación, humedad de suelo a 5cm (GWETTOP) y humedad de suelo a 100cm (GWETROOT) para las fechas entre el 01 de septiembre del 2023 al 1 de febrero del 2024.

Cargar los datos a un dataframe de pandas como se muestra al principio de la clase

Graficar los datos en matplotlib y seaborn de la siguiente manera:

* 1 grafico de lineas con los datos de humedad de suelo.
* 1 grafico de barras con los datos de precipitación.

En ambos casos asegurarse de que los gráficos tengan título, leyenda y nombre en los ejes.

Para mayor complejidad graficarlos en una misma figura.