# Visualización de datos en Pandas

![](https://miro.medium.com/max/1400/1*YguvfLum39leABj-kt0hMw.png)
La combinación de las librerías Pandas y Matplotlib permiten obtener gráficos a partir de los DataFrames. Aunque es posible utilzar los datos de un DataFrame como argumentos de las instrucciones para construír gráficos de Matplotlib, Pandas accede al Matplotlib API (esto es, a utilizar directamente las funciones gráficas de Matplotlib) de forma tal que puede utilizar sus propios métodos para generar los graficos resultantes.

Luis A.Muñoz (2022)

---

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import pandas_datareader as pdr
from datetime import datetime
plt.style.use('ggplot')      # Modificamos el formato del estilo para obtener gráficos más atractivos. Default:('classic')

## Pandas plot
El método df.plot() permite gráficar un DataFrame en una figura con varias opciones. Vamos a crear un DataFrame TimeSeries con datos aleatorios. El rango de fechas se genera con la propiedad `pd.date_range` de `pd.DataFrame`:

In [None]:
df = pd.DataFrame(data=np.random.randn(365), 
                 index=pd.date_range('2021/1/1', periods=365), 
                 columns=['Stock Price'])
df.head()

In [None]:
df = df.cumsum()
df.plot(figsize=(8, 6))
plt.show()

In [None]:
df = pd.DataFrame(data=np.random.randn(365, 4), 
                 index=pd.date_range('2021/1/1', periods=365), 
                 columns=['Stock 1', 'Stock 2', 'Stock 3', 'Stock 4'])
df.head()

In [None]:
df = df.cumsum()
df.plot(figsize=(8, 6))
plt.show()

Leamos datos reales disponibles en algun recurso web:

In [None]:
end = datetime.now()
start = datetime(end.year, 1, 1)

BTC = pdr.DataReader('BTC-USD', 'yahoo', start, end)

In [None]:
BTC.head()

In [None]:
BTC.plot(y='Close', figsize=(8, 6), label="BTC Close", title="BTC Price [USD]", marker='o', color='b')
plt.show()

Si se quiere graficar sobre un axes previamente habilitado, se puede especificar con la propiedad `ax`:

In [None]:
fig, ax = plt.subplots(figsize=(8, 6))
BTC.plot(y='Close', figsize=(8, 6), label="BTC Close", title="BTC Price [USD]", marker='o', ax=ax)
plt.show()

## Otros gráficos

Adicionalmente, se pueden obtener estos gráficos adicionales en Pandas:

* df.plot.area     
* df.plot.barh     
* df.plot.density  
* df.plot.hist         
* df.plot.scatter
* df.plot.bar      
* df.plot.box      
* df.plot.hexbin   
* df.plot.kde      
* df.plot.pie

También se puede llamar a `df.plot(kind='hist')` y reemplazar el argunento `kind` con cualquier termino mostrado en la lista anterior e.g. 'box','barh', etc..)

### Bar plot

In [None]:
df = pd.DataFrame(data=np.random.randint(10, 100, (10, 4)))
df.rename(columns=lambda x: "Data" + str(x), inplace=True)
df

In [None]:
df.plot.bar(y='Data0', figsize=(12, 6))
plt.show()

In [None]:
df.plot.bar(figsize=(12, 6))
plt.show()

In [None]:
df.plot.bar(figsize=(12, 6), stacked=True)   # color=['b', 'r', 'g', 'k']
plt.show()

In [None]:
df.plot.bar(subplots=True, layout=(2, 2), figsize=(12, 6))
plt.tight_layout()
plt.show()

### Pie plot

In [None]:
df.plot.pie(y='Data0', figsize=(12, 6), autopct="%.1f%%")
plt.show()

In [None]:
df.plot.pie(y='Data0', figsize=(12, 6), autopct="%.1f%%")
plt.legend(loc='lower left')
plt.show()

In [None]:
df.plot.pie(y='Data0', figsize=(12, 6), autopct="%.1f%%")
plt.legend(bbox_to_anchor=(1.2, 1))   # Pos de la leyenda ref 1x1 (x, y, width, height)
plt.show()

In [None]:
df[['Data0', 'Data1']].plot.pie(figsize=(12, 6), autopct="%.1f%%", subplots=True)
plt.show()

### Histograma

In [None]:
df = pd.DataFrame(data=np.random.randn(1000, 3))
df.plot.hist(y=0, bins=100, color='g', figsize=(8, 6))
plt.show()

In [None]:
df = pd.DataFrame(data=np.random.randn(1000, 3))
df.plot.hist(alpha=0.5, bins=100, figsize=(8, 6))
plt.show()

In [None]:
df = pd.DataFrame(data=np.random.randn(1000, 3))
df.plot.hist(alpha=0.5, bins=100, subplots=True, figsize=(8, 10))
plt.show()

### Scatter plot

In [None]:
df = pd.DataFrame(data=np.random.uniform(0, 2, (500, 3)),
                 columns=['C0', 'C1', 'C2'])
df.plot.scatter(x='C0', y='C1', figsize=(8, 6))
plt.show()

In [None]:
df.plot.scatter(x='C0', y='C1', c='C2', cmap='coolwarm', figsize=(8, 6))    # c = informacion de color
plt.show()

In [None]:
df.plot.scatter(x='C0', y='C1', s=df['C2']*200, alpha=0.5, figsize=(8, 6))   # s debe ser entero
plt.show()

## Seaborn: Otra librería gráfica
Seaborn es una librería gráfica muy utilizada en el ambiente de ciencia de datos, pues entrega resultados gráficos más estéticos y cuenta con más herramentas de visualización. Existen dos formas de utilizar `seaborn`: como soporte de `matplotlib` o como una librería independiente.

Vamos a reiniciar el estilo de `matpotlib` para verificar el estilo que `seaborn` agrega:

In [None]:
import matplotlib.pyplot as plt
plt.style.use('default')

In [None]:
df = pd.DataFrame(data=np.random.randn(365), 
                 index=pd.date_range('2021/1/1', periods=365), 
                 columns=['Stock Price'])
df = df.cumsum()
df.plot()
plt.show()

Seaborn agrega un API con instrucciones de alto-nivel sobre matplotlib, por lo que es posible seguir utilizando las instrucciones anteriores sin ningun cambio, ya que muchas funciones gráficas son reinterpretadas por seaborn:

In [None]:
import seaborn as sns
sns.set()

In [None]:
df = pd.DataFrame(data=np.random.randn(365), 
                 index=pd.date_range('2021/1/1', periods=365), 
                 columns=['Stock Price'])
df = df.cumsum()
df.plot()
plt.show()

Se obtienen resultados muy parecidos a el estilo `ggplot` de matplotlib. Por otro lado, se pueden utilizar las herramientas gráficas de seaborn directamente, con lo que se obtienen resultados gráficos más estéticos. Los detalles del uso de la librería de esta forma escapan del alcance de este curso, pero se muestra un péqueño código de referencia.

In [None]:
df = pd.DataFrame(data=np.random.randn(1000, 3))

g = sns.displot(data=df, alpha=0.5, kde=True)
g.fig.set_size_inches(6, 4)
plt.show()

## Streamlit: Web Dashboard con Python - Pandas
Existen algunas librerías que permite construir un sitio web utilizando Python (Flask, Django, FastAPI), pero una orintada especificamente a la ciencia de datos y a la creación de dashboards es Streamlit. La ventaja de esta librería es que, además de contar con un ambiente de prueba local, se puede alojar las aplicaciones en una nube gestionada por Streamlit.

Para hacer uso de la librería es necesaria instalarla:

    pip install streamlit

Nota: Como parte de las actualizaciones de Python, en el momento de las pruebas realizadas a la fecha (2024) presenta un conflicto con la versión 5 de la librería _altair_. Por eso se requiere asegurar que se cuenta con la versión anterior a la libreria:

    pip install altair==4

Una vez instalada la librería, esta necesita habilitarse desde el terminal para levantar un ambiente web con el código definido en un script. Por lo tanto, se debe de ejecutar con la instrucción:

    streamlit run <web_app_script>

Donde _web_app_script_ será la aplicación de python escrita donde se define el contenido de Web Dashboard. Se muestra un ejemplo simple de una aplicación:

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import streamlit as st
import pandas as pd

def plot_sine(amp, freq, color, grid_on):
    t = np.linspace(0, 1, 50 * round(freq))
    y = amp * np.sin(2 * np.pi * freq * t)
    
    fig, ax = plt.subplots(figsize=(6, 4))
    ax.plot(t, y, color=color)
    ax.grid(grid_on)
    ax.set_ylim(-13, 13)
    
    return fig


df = pd.DataFrame(np.random.uniform(1, 100, (20, 10)))

st.title("Onda Senoidal :sunglasses:")
col1, col2 = st.columns([1, 2])
    
with col1:
    amp = st.slider('Amplitud', 1, 12, )
    freq = st.slider('Frecuencia', 1, 10)
    color = st.selectbox("Color", ['red', 'blue', 'green'])
    chk = st.checkbox("Grilla", True)

with col2:
    st.pyplot(plot_sine(amp, freq, color, chk))    # fig
    st.data_editor(df)