In [57]:
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
import plotly.io as pio
from sklearn.linear_model import LinearRegression
from analisis_exploratorio.funciones import *

In [5]:
df = cargar_datos()
dict_atributos = diccionario_tipos_atributos()

In [74]:
def graficar_regresion(x, y):
    # nombres de columnas si vienen de Series
    x_name = getattr(x, "name", "x")
    y_name = getattr(y, "name", "y")

    X = np.array(x).reshape(-1, 1)
    modelo = LinearRegression()
    modelo.fit(X, y)

    pendiente = modelo.coef_[0]
    interseccion = modelo.intercept_

    # línea de regresión
    x_line = np.linspace(x.min(), x.max(), 100).reshape(-1, 1)
    y_line = modelo.predict(x_line)

    # scatter
    fig = px.scatter(
        x=x,
        y=y,
        opacity=1,
        title=f"Regresión lineal: {y_name} ~ {x_name}",
        labels={"x": x_name, "y": y_name}
    )

    # agregar línea de regresión
    fig.add_trace(
        go.Scatter(
            x=x_line.flatten(),
            y=y_line,
            mode="lines",
            name="Recta de regresión",
            line=dict(color="red", width=3)
        )
    )

    # agregar anotación con la ecuación
    fig.add_annotation(
        x=1,  # posición horizontal (podes ajustar)
        y=1,  # posición vertical (podes ajustar)
        xref="paper",
        yref="paper",
        text=f"y = {pendiente:.2f}x + {interseccion:.2f}",
        showarrow=False,
        font=dict(color="blue", size=14),
        bgcolor="white",
        bordercolor="blue",
        borderwidth=1
    )

    fig.update_layout(
        paper_bgcolor="black",
        plot_bgcolor="black",
    )
    pio.write_html(fig, file=f"./graficos/regresiones_lineales_shares/regresion_shares-{x_name}.html", auto_open=False, full_html=True, include_plotlyjs='cdn')
    #fig.show() # Descomentar para ver en jupyter

In [71]:
graficar_regresion(df["num_imgs"], df["shares"])

In [72]:
#Grafico por grupo de atributos
for atributo in dict_atributos['atributos_cantidad']:
    graficar_regresion(df[atributo], df["shares"])

In [73]:
# Grafico de todos los atributos numericos vs shares
for grupo_atr, atributos in dict_atributos.items():
    for atributo in atributos:
        graficar_regresion(df[atributo], df["shares"])