# Big Data y Machine Learning (UBA) 2025
## Clase 2 - Parte 2

El objetivo es graficar con matplotlib.

## Matplotlib
**Matplotlib** es la librería base de graficación, sobre la cual se montan otras librerías. Dentro de Matplotlib, usamos la dependencia "pyplot" que se instala con la librería. Por convención importamos así:

In [None]:
# Primero, instalar la libreria:
#pip install matplotlib
import matplotlib.pyplot as plt # importamos la librería gráfica. plt es el nombre por convención que se le asigna

**Matplotlib** genera los gráficos sobre dos objetos interrelacionados:
- Figura (*Figure*): la hoja en blanco, el recuadro que contiene hacia adentro el/los gráfico/s. En términos prácticos esto ocurre detrás de escenas, pero es lo que permite dibujar el gráfico.
- Ejes (*Axes*): el gráfico en sí, los ejes y la informacíon graficada. La representación de la información sobre ejes.

Las partes de un gráfico
<img src="https://matplotlib.org/stable/_images/anatomy.png"
     width=500/>

Hay esencialmente dos maneras de graficar con Matplotlib:
- **Estilo pyplot**: simple y rápida para figuras que no son muy avanzadas. Quizás más fácil para empezar.
- **Estilo orientado-objetos**: un poco más complejo pero necesario para figuras que requieren mucha personalización.

En cuanto al resultado estético, con ambos se puede lograr la misma calidad. Para dar los primeros pasos es indistinto cual se use. Sin embargo, el estilo orientado a objetos es necesario para figuras más complejas donde hay varios gráficos (subplots) y es necesario definir parámetros distintos para cada par de ejes (2D)

### Graficar con matplotlib

In [None]:
import matplotlib.pyplot as plt
import pandas as pd
import os

Ubicar la carpeta donde hayan descargado el archivo para esta parte de visualización

In [None]:
os.getcwd()

In [None]:

os.chdir("/Users/mnromero/Dropbox/COURSES/2025 - S2 - Big Data y Machines Learning (UBA)/Clases/Clase 02 Visualizacion II_Hist & Kernels/archivos P2_Matplotlib")

In [None]:
# Abrimos el archivo de potencia energética instalada en el país
df = pd.read_excel("potencia_instalada.xlsx")

In [None]:
 # exploren aqui la base. Hint: tail, head, sample, info...
df

In [None]:
# Agregamos (collapse) a nivel de tipo de fuente
df_fuente = df.groupby(by=["periodo","fuente_generacion"]).agg({"potencia_instalada_mw":"sum"})
df_fuente.reset_index(inplace=True)
df_fuente.sample(5)


In [None]:
df_fuente.shape

### Grafico de tendencia
Vamos a graficar dos líneas, así que definimos vector X (*periodo*) e Y (*series de tiempo*) para cada una. Vamos a graficar la potencia instalada de generación por fuente *Renovable* y *Térmica*.

*Nota*: `df[condicion][columna]` selecciona la "columna" de la base que resulta de aplicar el filtro `df[condicion]`.

In [None]:
# Definimos  vectores  de datos  para  serie 1 (renovable)
y1 = df_fuente[df_fuente["fuente_generacion"]=="Renovable"]["potencia_instalada_mw"]
x1 = df_fuente[df_fuente["fuente_generacion"]=="Renovable"]["periodo"]
# Definimos  vectores  de datos  para  serie 2 (térmica)
y2 = df_fuente[df_fuente["fuente_generacion"]=="Térmica"]["potencia_instalada_mw"]
x2 = df_fuente[df_fuente["fuente_generacion"]=="Térmica"]["periodo"]

#### Gráfico al estilo `pyplot`

In [None]:
# Creamos el gráfico al estilo pyplot
plt.plot(x1, y1, label="Renovable") # serie 1
plt.plot(x2, y2, label="Térmica") # serie 2
# Estas  dos  líneas  estaran  sobre  el mismo  gráfico

# Modifico  labels
plt.xlabel("Período")
plt.ylabel("Potencia  Instalada (en MW)")
plt.title("Figura 1. Producción Energética Argentina\nsegún Fuente")

# Agrego  leyenda
plt.legend()
plt.show() #esto es necesario para visualizar


Una buena practica es exportar todas las figuras en una carpeta por aparte para ser ordenados. Lo que haremos ahora es guardar el directorio de ubicación de dicha carpeta y, si no existe la carpeta, que cree nuestra carpeta de figuras.

In [None]:
# Ruta de la carpeta donde se guardará el gráfico
carpeta = '/Users/mnromero/Dropbox/COURSES/2025 - S2 - Big Data y Machines Learning (UBA)/Clases/Clase 02 Visualizacion II_Hist & Kernels/figuras'

# Verifica si la carpeta existe, si no, créala
if not os.path.exists(carpeta):
    os.makedirs(carpeta)

In [None]:
# Volvemos a graficar
plt.plot(x1, y1, label="Renovable") # serie 1
plt.plot(x2, y2, label="Térmica") # serie 2
# Estas  dos  líneas  estaran  sobre  el mismo  gráfico

# Modifico  labels
plt.xlabel("Período")
plt.ylabel("Potencia  Instalada (en MW)")
plt.title("Figura 1. Producción Energética Argentina\nsegún Fuente")

# Agrego  leyenda
plt.legend()

# Guardamos el gráfico en la carpeta (no usamos la funcion .show() para ahora guardarla)
plt.savefig(os.path.join(carpeta, 'figura_1.pdf'), bbox_inches='tight', dpi=300)

#### Creamos el gráfico al estilo OO (orientado-objetos)

In [None]:
# Creamos la figura y los axes
fig, ax = plt.subplots() # crear objetos

# Definimos series
ax.plot(x1, y1, label="Renovable") # Serie 1
ax.plot(x2, y2, label="Térmica") # Serie 2

# Modificamos labels y título
ax.set_xlabel("Período")
ax.set_ylabel("Potencia  Instalada (en MW)")
ax.set_title("Producción Energética Argentina\nsegún Fuente (v2)")

# Agregamos leyenda
ax.legend()
# Guardamos el gráfico en la carpeta (no usamos la funcion .show() para ahora guardarla)
plt.savefig(os.path.join(carpeta, 'figura_2.png'), bbox_inches='tight', dpi=300)

#### Graficar múltiples gráficos estilo `pyplot`

In [None]:
# ejemplo 2 ax en un fig
plt.figure(figsize=(14, 5))

# Definimos primer panel
plt.subplot(121) # subplot(nrows, ncols, index, **kwargs) donde nrows=1, ncols=2, index=1
plt.plot(x1, y1)
plt.title("A. Fuente Renovable")

# Definimos segundo panel
plt.subplot(122)
plt.plot(x2, y2)
plt.title("B. Fuente Térmica")

# Definimos título general de la figura
plt.suptitle("Ejemplo dos paneles en una figura")
# Guardamos el gráfico en la carpeta (no usamos la funcion .show() para ahora guardarla)
plt.savefig(os.path.join(carpeta, 'figura_3_paneles.png'), bbox_inches='tight', dpi=300)

#### Graficar múltiples gráficos estilo orientado a objetos (o-o)

In [None]:
# ejemplo 2 ax en un fig
fig, ax = plt.subplots(figsize=(14, 5), ncols=2, nrows=1)

# Definimos primer panel
ax[0].plot(x1, y1)
ax[0].set_title("A. Fuente Renovable")

# Definimos segundo panel
ax[1].plot(x2, y2)
ax[1].set_title("B. Fuente Térmica")

# Definimos título general de la figura
fig.suptitle("Ejemplo dos gráficos en una figura")
# Guardamos el gráfico en la carpeta (no usamos la funcion .show() para ahora guardarla)
plt.savefig(os.path.join(carpeta, 'figura_4_paneles_o-o.png'), bbox_inches='tight', dpi=300)

*Comentario*: un gráfico orientado a objetos (O-O) en Matplotlib se refiere al uso explícito de los objetos `Figure` y `Axes` para crear y controlar un gráfico. Esto contrasta con el enfoque stateful (`pyplot`), que modifica el estado global de la visualización.


### Gráficos avanzados con `ipywidgets`

Los widgets en Python son objetos que tienen una representación en el navegador. Por ejemplo, los widgets pueden tener forma de una caja de texto, un desplegable, una casilla de verificación, etc.
Más info sobre ipywidgets [acá](https://ipywidgets.readthedocs.io/en/latest/examples/Widget%20Basics.html)

In [None]:
pip install ipywidgets

In [None]:
import matplotlib.pyplot as plt
import ipywidgets as widgets
from IPython.display import display

import datetime

In [None]:
boton = widgets.Button(description='Haz clic')
display(boton)

In [None]:
widgets.IntSlider()

In [None]:
lista_fuentes = list(set(df_fuente['fuente_generacion']))
lista_fuentes

In [None]:
# Seleccionar tipo de fuente
print("Seleccionar Fuente:")
fuente = widgets.Dropdown(
    options=['Nuclear','Renovable',  'Hidráulica', 'Térmica'],
    value='Nuclear', # "Nuclear" es la opción seleccionada de forma predeterminada cuando se crea el widget
    description='Fuente:',
    disabled=False # widget activo. si disabled=True, el widget se vuelve inactivo y el usuario no puede interactuar con él.
)
display(fuente) # Muestra el widget

In [None]:
fechas = list(set(df_fuente['periodo'].dt.strftime("%y-%m"))) 
# set para eliminar duplicados
# strftime() para formatear la fechas en un string según un formato deseado. 
# "%y-%m" formato tal que se muestren los últimos dos dígitos del año (%y) seguidos por el mes (%m).
fechas.sort()
fechas

In [None]:
select_fecha = widgets.SelectionRangeSlider(
    options=fechas,
    index=(0, len(fechas)-1),
    description='Fechas',
    disabled=False
)
display(select_fecha)

In [None]:
# Probamos si los valores quedaron actualizados
# Para usar los valores definidos usamos .value

print("El rango de fechas a usar es: ", select_fecha.value)
print("La fuente a mostrar es: ", fuente.value)

In [None]:
# Creamos un dataframe con la selección de filas de la fuente elegida
df_temp =  df_fuente[df_fuente['fuente_generacion'] == fuente.value]

# Extraemos el objeto fecha del string creado a partir del widget
fecha_min = datetime.datetime.strptime(select_fecha.value[0], "%y-%m") 
fecha_max = datetime.datetime.strptime(select_fecha.value[1], "%y-%m")
# con el módulo datetime y su función strptime creamos un objeto datetime (que contiene info de date y time)

# Filtramos según fechas elegidas
df_temp = df_temp[(df_temp['periodo']>fecha_min)&(df_temp['periodo']<fecha_max)]

print("Evolución de la potencia instalada de fuente: {}".format(fuente.value))
# Creamos el grafico
plt.plot(df_temp['periodo'], df_temp['potencia_instalada_mw'], label=fuente.value) 
# Modificamos labels
plt.xlabel('Periodo')
plt.xticks(rotation=20)
plt.ylabel('Potencia Instalada (MW)')

# Agregamos leyenda
plt.legend()
plt.show()