# Plotly Graph Objects

El desarrollo de la librería `plotly` está orientado a objetos, de tal manera que en los gráficos que hemos visto, las barras, las líneas, los puntos; todo son objetos. La librería nos ofrece una API de bajo nivel llamada `graph_objects` para poder utilizar estos objetos a nuestro antojo.

Mientras que con `plotly.express` podemos crear visualizaciones de manera extremadamente sencilla igual que con `seaborn`, con `plotly.graph_objects` podemos crear visualizaciones de una forma más compleja pero flexible, igual que con `matplotlib.pyplot`. Además, podemos utilizar el submódulo `graph_objects` para añadir elementos a los plots creados con `plotly.express`, igual que podemos enriquecer una visualización de `seaborn` usando `matplotlib.pyplot`.

__Documentación:__ https://plotly.com/python-api-reference/plotly.graph_objects.html

In [1]:
import datetime

import numpy as np
import pandas as pd

import plotly # Para ver la versión
import plotly.express as px
import plotly.graph_objects as go

In [2]:
 # Versiones

print(f"numpy=={np.__version__}")
print(f"pandas=={pd.__version__}")
print(f"plotly=={plotly.__version__}")

numpy==2.2.0
pandas==2.2.3
plotly==5.24.1


#### Data

In [3]:
df = pd.read_csv("../Data/co2_emissions.csv").sample(5000)

In [4]:
df

Unnamed: 0,Model Year,Make,Model,Vehicle Class,Engine Size,Cylinders,Transmission,Fuel Type,Fuel Consumption City,Fuel Consumption Hwy,Fuel Consumption Comb,Fuel Consumption Comb (mpg),CO2 Emissions
20884,2017,MERCEDES-BENZ,SL 550,TWO-SEATER,4.7,8.0,A9,Prm. Gasoline,13.6,9.5,11.7,24.0,275
2123,1997,SUZUKI,X-90,SUV,1.6,4.0,M5,Reg. Gasoline,10.8,8.8,9.9,29.0,228
17042,2014,CHEVROLET,SONIC 5 RS,MID-SIZE,1.4,4.0,AS6,Reg. Gasoline,9.4,7.0,8.3,34.0,191
19325,2016,DODGE,JOURNEY,SUV - SMALL,2.4,4.0,A4,Reg. Gasoline,12.7,9.1,11.1,25.0,260
26070,2022,PORSCHE,CAYENNE S,SUV - STANDARD,2.9,6.0,AS8,Prm. Gasoline,14.7,10.6,12.9,22.0,307
...,...,...,...,...,...,...,...,...,...,...,...,...,...
7688,2005,FORD,THUNDERBIRD,TWO-SEATER,3.9,8.0,AS5,Prm. Gasoline,14.9,10.6,13.0,22.0,299
1074,1996,FORD,E150 CLUB WAGON,VAN - PASSENGER,4.9,6.0,A4,Reg. Gasoline,21.1,15.5,18.6,15.0,428
3301,1999,MERCURY,MYSTIQUE,COMPACT,2.5,6.0,A4,Reg. Gasoline,13.4,9.1,11.5,25.0,265
13983,2011,GMC,CANYON CREW CAB 4WD,PICKUP TRUCK - SMALL,5.3,8.0,A4,Reg. Gasoline,17.0,12.2,14.9,19.0,343


####  Figure
`go.Figure()`

https://plotly.com/python-api-reference/generated/plotly.graph_objects.Figure.html

Las visualizaciones que obtenemos al utilizar las funciones de `plotly.express` son objetos `Figure`. Podemos crear una instancia de `Figure` vacía utilizando `plotly.graph_object`.

In [5]:
fig = go.Figure() # Instancializamos

In [6]:
fig.show() # Utilizamos .show() para mostrar el plot. No es necesario en los notebooks, pero sí en ficheros .py

Podemos utilizar el método `.update_layout()` para cambiar varios aspectos de nuestra instancia de `Figure`, sin importar si la hemos creado nosotros, o si es el retorno de alguna función de `plotly.express`.

In [7]:
fig.update_layout(
    title = "Un plot vacío", # Título de nuestro plot
    xaxis_title = "Eje X", # Título del eje X
    yaxis_title = "Eje Y", # Título del eje Y
)

fig.show()

Los cambios de `.update_layout()` son in-place. Podemos llamar el método otra vez para seguir añadiendo modificaciones al plot, o podemos llamárlo solo en una ocasión aplicando todas las modificaciones de una vez.

In [8]:
fig.update_layout(
    height = 400,
    width = 400
)

fig.show()

Algunos parámetros de este método toman como entrada un diccionario donde las claves las podemos entender como sub-parámetros y los valores como argumentos. En este ejemplo estamos modificando el mínimo y máximo que se muestra en los ejes.

In [9]:
fig.update_layout(
    xaxis = {"range" : [0,10]},
    yaxis = {"range" : [0,10]}
)

fig.show()

Y en este ejemplo estamos modificando el tamaño de todas las fuentes.

In [10]:
fig.update_layout(
    font = {"size" : 32},
)

fig.show()

Y aquí estamos modificando el tamaño de fuente de los valores de los ejes.

In [11]:
fig.update_layout(
    xaxis = {"tickfont" : {"size" : 6}},
    yaxis = {"tickfont" : {"size" : 6}}
)

fig.show()

Si queremos que alguno de los elementos vuelva a su estado original, basta con marcarlo como `None` dentro del método.

In [12]:
fig.update_layout(
    title = None,
    xaxis_title = None,
    yaxis_title = None,
    height = None,
    width = None,
    xaxis = {
        "range" : None,
        "tickfont" : {"size" : None}
    },
    yaxis = {
        "range" : None,
        "tickfont" : {"size" : None}
    },
    font = {"size" : None},
)

fig.show()

Por último, podemos utilizar el método `.add_trace()` para añadir eleméntos gráficos a nuestro plot. A continuación veremos algunos ejemplos.

#### Scatter
`go.Scatter()`

El objeto `Scatter` representa una visualización de dispersión de puntos. Podemos instancializar un objeto `Scatter` y añadirlo a nuestra figura.

In [13]:
# Datos
X = df["Fuel Consumption Comb"]
Y = df["CO2 Emissions"]

# Instancialización de Scatter
trace = go.Scatter(
    x = X,
    y = Y,
    mode = "markers",
)

# mode: None, "lines", "markers"

In [14]:
fig.add_trace(trace) # opción para hacer gráficos más avanzados y personalizables

fig.show()

Podemos acceder a un trazado que hayamos añadido, a través del atributo `.data` de nuestra figura. Esto nos retorna una tupla con todos los trazados que tiene la figura. Si aun conservamos la instancia del trazado que nos interesa, podemos utilizar el método `.index()` sobre la tupla para recuperarlo y realizar modificaciones.

In [15]:
trace_idx = fig.data.index(trace)

trace = fig.data[trace_idx]

trace

Scatter({
    'mode': 'markers',
    'x': array([11.7,  9.9,  8.3, ..., 11.5, 14.9,  9.1], shape=(5000,)),
    'y': array([275, 228, 191, ..., 265, 343, 209], shape=(5000,))
})

Ahora habiendo recuperado el trazado, podemos modificarlo en caso de ser necesario. Esto se verá reflejado posteriormente en la figura, ya que las operaciones que estaremos realizando son in-place (fíjate que no tenemos que volver a realizar la operación `.add_trace()`).

In [16]:
df_ = df.groupby("Model Year").mean(numeric_only=True).reset_index()

X = df_["Model Year"].apply(lambda x: datetime.datetime.strptime(str(x), "%Y"))
Y = df_["CO2 Emissions"]

trace.update(
    x = X,
    y = Y,
    mode = "lines" # Utilizamos mode = "lines" para un trazado de lineas en lugar de puntos
)

fig.show()

Podemos añadir todos los trazados que queramos.

In [17]:
fig = go.Figure()

for fuel in df["Fuel Type"].unique():
    df_ = df[df["Fuel Type"] == fuel]
    
    X = df_["Fuel Consumption Comb"]
    Y = df_["CO2 Emissions"]

    trace = go.Scatter(
        x = X,
        y = Y,
        mode = "markers",
        name = fuel,
#         marker = { # ESTO RELENTIZA EL PLOT
#             "size" : df_["Engine Size"] * 3,
#             "opacity" : 0.5
#         }
    )
    
    fig.add_trace(trace)

fig.show()

In [18]:
fig = go.Figure()

for fuel in df["Fuel Type"].unique():
    df_ = df[df["Fuel Type"] == fuel].groupby("Model Year").mean(numeric_only=True).reset_index()
    
    X = df_["Model Year"].apply(lambda x: datetime.datetime.strptime(str(x), "%Y"))
    Y = df_["CO2 Emissions"]

    trace = go.Scatter(
        x = X,
        y = Y,
        mode = "lines",
        name = fuel
    )
    
    fig.add_trace(trace)

fig.show()

#### Bar
`go.Bar()`

In [19]:
df_ = df.groupby("Make").mean(numeric_only=True).reset_index().sort_values("CO2 Emissions", ascending=False)
X = df_["Make"]
Y = df_["CO2 Emissions"]

trace = go.Bar(
    x = X,
    y = Y
)

fig = go.Figure()

fig.add_trace(trace)

fig.update_layout(
    xaxis = {
        "tickfont" : {"size" : 10},
        "tickangle" : 45 # Rotamos las etiquetas del eje X
    }
)

fig.show()

In [20]:
df_ = df.groupby("Make").mean(numeric_only=True).reset_index().sort_values("CO2 Emissions")
Y = df_["Make"]
X = df_["CO2 Emissions"]

trace = go.Bar(
    x = X,
    y = Y,
    orientation = "h",
    marker = {
        "color" : "lightgreen"
    }
)

fig = go.Figure()

fig.add_trace(trace)

fig.update_layout(
    height = 1000,
    width = 800
)

fig.show()

#### Histogram
`go.Histogram()`

In [21]:
X_1 = df["Fuel Consumption City"]
X_2 = df["Fuel Consumption Hwy"]

trace_1 = go.Histogram(
    x = X_1,
    name = "Fuel Consumption City",
    opacity = 0.6,
    xbins = {
        "size" : 0.5
    },
    marker = {
        "color" : "yellow"
    }
)

trace_2 = go.Histogram(
    x = X_2,
    name = "Fuel Consumption Hwy",
    opacity = 0.6,
    xbins = {
        "size" : 0.5
    },
    marker = {
        "color" : "cyan"
    }
)

fig = go.Figure()

fig.add_trace(trace_1)
fig.add_trace(trace_2)

fig.update_layout(barmode='overlay') # Para que las barras del histograma se solapen

fig.show()

Podemos agregar estadística descriptiva a nuestra figura.

In [22]:
median_city = df["Fuel Consumption City"].median()
median_hwy = df["Fuel Consumption Hwy"].median()

trace_median_city = go.Scatter(
    x = [median_city, median_city],
    y = [0, 600],
    mode = "lines",
    line = {
        "color" : "gold"
    }
)

trace_median_hwy = go.Scatter(
    x = [median_hwy, median_hwy],
    y = [0, 600],
    mode = "lines",
    line = {
        "color" : "darkcyan"
    }
)

fig.add_trace(trace_median_city)
fig.add_trace(trace_median_hwy)

fig.show()

#### Box
`go.Box()`

In [23]:
Y_1 = df["Fuel Consumption City"]
Y_2 = df["Fuel Consumption Hwy"]
Y_3 = df["Fuel Consumption Comb"]

trace_1 = go.Box(
    y = Y_1,
    name = "City"
)

trace_2 = go.Box(
    y = Y_2,
    name = "Highway"
)

trace_3 = go.Box(
    y = Y_3,
    name = "Comb",
)

fig = go.Figure()

fig.add_trace(trace_1)
fig.add_trace(trace_2)
fig.add_trace(trace_3)

fig.show()

## Plotly Express y Plotly GO

Podemos crear nuestras figuras utilizando `plotly.express`.

In [24]:
fig = px.scatter(
    data_frame = df,
    x = "Fuel Consumption Comb",
    y = "CO2 Emissions",
    color = "Fuel Type",
    size = "Engine Size",
    opacity = 0.3,
)

fig.show()

Y podemos aprovechar las funcionalidades más básicas de `plotly.graph_objects` para enriquecer nuestro plot.
Aquí un ejemplo:

In [25]:
# Cambios en la figura
fig.update_layout(
    title = "Relación consumo-emisiones", # Título
    title_x = 0.5, # Posición horizontal del título
    title_y = 0.98, # Posición vertical del título
    title_xanchor = "center", # Punto de anclaje horizontal del título con respecto a la posición
    title_yanchor = "top", # Punto de enclaje vertical del título con respecto a la posición
    
    plot_bgcolor = "rgb(0.4,0.4,0.4)", # Color de fondo del plot
    paper_bgcolor = "rgb(0.25,0.25,0.25)", # Color de fondo del padding alrededor del plot
    
    # Cambios en la fuente
    font = {
        "size" : 20, # Tamaño de la fuente
        "color" : "aliceblue" # Color de la fuente
    },
    
    # Cambios en el eje X
    xaxis = {
        "title" : "Consumo", # Título
        
        # Cambios en la fuente del título
        "titlefont" : {
            "size" : 18 # Tamaño de la fuente
        },
        
        # Cambios en la fuente de las etiquetas
        "tickfont" : {
            "size" : 12 # Tamaño de la fuente
        },
        
        # Cambios en la cuadrícula
        "gridcolor" : "rgba(1,1,1,0.1)",
        "gridwidth" : 1,
        "showgrid" : True
    },
    
    # Cambios en el eje Y (Igual que el eje X)
    yaxis = {
        "title" : "Emisiones",
        "titlefont" : {
            "size" : 18
        },
        "tickfont" : {
            "size" : 12
        },
                
        # Cambios en la cuadrícula
        "gridcolor" : "rgba(1,1,1,0.1)",
        "gridwidth" : 1,
        "showgrid" : True
    },
    
    # Cambios en la leyenda
    legend = {
        "title" : "Tipo de combustible", # Título de la leyenda
        
        # Cambios en la fuente
        "font" : {
            "size" : 14 # Tamaño de la fuente
        }
    },
    
    
    
)

# Cambios en los trazados
for trace in fig.data:
    trace.update(
        marker = {
            "line" : {
                "color" : "rgba(0.25,0.25,0.25,0.25)" # Cambiamos el color del contorno de los círculos
            }
        }
    )
    
# Añadimos trazado con la tendencia general (IGNORAR USO DE SCIKIT LEARN)
from sklearn.linear_model import LinearRegression

# Código de regresión (IGNORAR)
model = LinearRegression()
model.fit(df[["Fuel Consumption Comb"]], df["CO2 Emissions"])
slope = model.coef_[0]
intercept = model.intercept_

x = np.linspace(df["Fuel Consumption Comb"].min(), df["Fuel Consumption Comb"].max(),5000)
y = slope * x + intercept

# Trazado regresión
reg_trace = go.Scatter(
    x = x,
    y = y,
    mode = "lines",
    name = "Trend",
    line = {
        "color" : "aliceblue",
    }
)

fig.add_trace(reg_trace)

fig.show()

ModuleNotFoundError: No module named 'sklearn'