# Plotly

Plotly es una librería de Python para crear gráficos interactivos de alta calidad. A diferencia de Matplotlib, que generan visualizaciones estáticas, Plotly permite que los gráficos sean dinámicos, con zoom, tooltips, filtros y la posibilidad de integrarlos en aplicaciones web como Dash.

### Ventajas:

* Gráficos interactivos por defecto.

* Integración con Jupyter Notebook, Dash, y frameworks web.

* Soporta múltiples tipos de gráficos (barras, líneas, dispersión, mapas, 3D).

* Exportación a HTML y PNG.

# Instalación


In [None]:
!pip install numpy plotly pandas matplotlib

# Documentacion oficial:

https://plotly.com/python/

### Para generar graficos de una forma facil se utiliza plotly.express

plotly.express es un módulo de alto nivel de la librería Plotly en Python, diseñado para crear gráficos de forma rápida y sencilla con muy pocas líneas de código.

Tipos de graficos y funcion a utilizar

| **Categoría**             | **Función**               | **Descripción**                                               |
| ------------------------- | ------------------------- | ------------------------------------------------------------- |
| **Básicos**               | `px.scatter`              | Dispersión (x vs y, con color, tamaño, animación).            |
|                           | `px.line`                 | Línea (series temporales o tendencias).                       |
|                           | `px.area`                 | Gráfico de área (puede ser apilada).                          |
|                           | `px.bar`                  | Barras verticales u horizontales.                             |
|                           | `px.histogram`            | Histograma (distribución de frecuencias).                     |
|                           | `px.box`                  | Diagrama de caja (outliers, cuartiles).                       |
|                           | `px.violin`               | Violin plot (distribución + densidad).                        |
|                           | `px.strip`                | Strip plot (dispersión unidimensional).                       |
|                           | `px.ecdf`                 | Función de distribución acumulada.                            |
| **Multivariados**         | `px.scatter_matrix`       | Matriz de dispersión entre múltiples variables.               |
|                           | `px.parallel_coordinates` | Coordenadas paralelas (comparar varias variables numéricas).  |
|                           | `px.parallel_categories`  | Categorías paralelas (comparar varias variables categóricas). |
|                           | `px.density_contour`      | Contornos de densidad en 2D.                                  |
|                           | `px.density_heatmap`      | Mapa de calor de densidad.                                    |
| **Jerárquicos**           | `px.treemap`              | Árbol jerárquico proporcional al valor.                       |
|                           | `px.sunburst`             | Gráfico de rayos de sol (jerarquía circular).                 |
|                           | `px.icicle`               | Jerarquía en forma de cascada vertical.                       |
| **Mapas / Geoespaciales** | `px.scatter_geo`          | Puntos en mapas (lat/lon o nombres de países).                |
|                           | `px.choropleth`           | Mapa coroplético por regiones/países.                         |
|                           | `px.choropleth_mapbox`    | Mapa coroplético usando Mapbox.                               |
|                           | `px.scatter_mapbox`       | Puntos en mapas con Mapbox.                                   |
|                           | `px.density_mapbox`       | Mapa de densidad con Mapbox.                                  |
|                           | `px.line_geo`             | Líneas geográficas (sobre proyecciones).                      |
|                           | `px.line_mapbox`          | Líneas en mapas con Mapbox.                                   |
| **Otros**                 | `px.imshow`               | Visualización de imágenes o matrices (mapa de calor rápido).  |
|                           | `px.timeline`             | Línea de tiempo estilo Gantt.                                 |
|                           | `px.funnel`               | Gráfico de embudo (procesos secuenciales).                    |
|                           | `px.funnel_area`          | Embudo radial (área circular).                                |
|                           | `px.pie`                  | Gráfico de pastel.                                            |


### Nota: Seleccion de render

Para su visualización con jupyer o vscode es necesario definir el tipo de render

opciones: notebook , browser

In [58]:
import plotly.io as pio
pio.renderers.default = "notebook" 

# Ejecución con datos de ejemplo

In [None]:
import plotly.express as px

df = px.data.iris()  # Dataset de ejemplo
fig = px.scatter(df, x="sepal_width", y="sepal_length",
                 color="species", size="petal_length",
                 title="Gráfico de dispersión - Iris")
fig.show()

# Gráfico de barras

In [None]:
df = px.data.tips()
fig = px.bar(df, x="day", y="total_bill", color="sex", barmode="group")
fig.show()

# Histograma

In [None]:
fig = px.histogram(df, x="total_bill", nbins=30, color="sex")
fig.show()

# Gráficos 3D

In [None]:
df = px.data.gapminder().query("year == 2007")
fig = px.scatter_3d(df, x="gdpPercap", y="lifeExp", z="pop",
                    color="continent", size="pop")
fig.show()

# Mapas

In [None]:
df = px.data.gapminder().query("year == 2007")
fig = px.choropleth(df, locations="iso_alpha", color="gdpPercap",
                    hover_name="country", projection="natural earth",
                    title="PIB per cápita en 2007")
fig.show()

# Crear un archivo HTML Interactivo

utilizando el metodo write_html:

fig.write_html("grafico.html")

In [None]:
df = px.data.gapminder().query("year == 2007")
fig = px.choropleth(df, locations="iso_alpha", color="gdpPercap",
                    hover_name="country", projection="natural earth",
                    title="PIB per cápita en 2007")
fig.write_html("grafico.html")

# Ejercicio completo

### 1. Carga y exploración de datos

In [None]:
import pandas as pd

# Cargar CSV
df = pd.read_csv("datasets/dataset_ventas_diarias.csv")

# Vista inicial
print(df.head())
print(df.info())

In [None]:
# Transformamos la columna de fecha 

df["fecha"] = pd.to_datetime(df["fecha"], errors="coerce")

# creamos campos derivados:
     
df["anio"] = df["fecha"].dt.year
df["mes"] = df["fecha"].dt.month
df["dia_semana"] = df["fecha"].dt.day_name()

# Traducción de días
dias_map = {
    'Monday': 'Lunes', 'Tuesday': 'Martes', 'Wednesday': 'Miércoles',
    'Thursday': 'Jueves', 'Friday': 'Viernes', 'Saturday': 'Sábado',
    'Sunday': 'Domingo'
}
df["dia_semana"] = df["dia_semana"].map(dias_map)

print(df.head())
print(df.info())

### 2. Gráficos de interés con Plotly

In [None]:
# Ventas diarias (serie temporal)

import plotly.express as px

ventas_dia = df.groupby("fecha")["ventas"].sum().reset_index()
fig = px.line(ventas_dia, x="fecha", y="ventas",
              title="Ventas totales por día")
fig.show()

In [None]:
# top 10 productos más vendidos
top_prod = df.groupby("categoria")["ventas"].sum().reset_index()

fig = px.bar(top_prod, x="categoria", y="ventas",
             title="Top 10 categoria por ventas",
             text="ventas")
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.show()

In [None]:
### Ventas por dia de la semana
orden_dias = ["Lunes","Martes","Miércoles","Jueves","Viernes","Sábado","Domingo"]
ventas_sem = (df.groupby("dia_semana", as_index=False)["ventas"].sum()
                .set_index("dia_semana").reindex(orden_dias).reset_index())
fig = px.bar(ventas_sem, x="dia_semana", y="ventas",
             title="Ventas por día de la semana")
fig.show()

In [None]:
# ventas por region
import numpy as np
import plotly.express as px

# Agregación y orden
ventas_reg = (df.groupby("region", as_index=False)["ventas"].sum()
                .sort_values("ventas", ascending=True))
ventas_reg["participacion"] = ventas_reg["ventas"] / ventas_reg["ventas"].sum()

# Gráfico
fig = px.bar(
    ventas_reg,
    y="region", x="ventas",
    orientation="h",
    title="Ventas por región",
    text=ventas_reg["ventas"].map(lambda v: f"${v:,.0f}")  # etiqueta legible
)

# Estilo de trazos y hover
fig.update_traces(
    textposition="outside",
    marker_line_width=1,
    marker_line_color="rgba(0,0,0,0.25)",
    hovertemplate=(
        "Región: %{y}<br>"
        "Ventas: %{x:,.0f}<br>"
        "Participación: %{customdata:.1%}"
        "<extra></extra>"
    ),
    customdata=ventas_reg["participacion"].values
)

# Layout limpio y orden por total
fig.update_layout(
    template="plotly_white",
    xaxis_title="Ventas",
    yaxis_title="Región",
    xaxis_tickformat=",",  # separador de miles
    uniformtext_minsize=10,
    uniformtext_mode="hide",
    margin=dict(l=110, r=40, t=60, b=40)
)
fig.update_yaxes(categoryorder="total ascending")

fig.show()

In [None]:
### Distribución de ventas (histograma)

fig = px.histogram(df, x="ventas", nbins=40,
                   title="Distribución de montos de venta")
fig.show()

In [None]:
# Mapa de calor 
tabla = (df.pivot_table(index="categoria", columns="dia_semana", values="ventas", aggfunc="sum")
           .reindex(columns=["Lunes","Martes","Miércoles","Jueves","Viernes","Sábado","Domingo"]))
tabla = tabla.fillna(0).reset_index().melt(id_vars="categoria", var_name="dia_semana", value_name="ventas")

fig = px.density_heatmap(tabla, x="dia_semana", y="categoria", z="ventas",
                         title="Heatmap de ventas: Categoría × Día de la semana", nbinsx=7, nbinsy=len(tabla["categoria"].unique()))
fig.show()

In [None]:

# --- Paso 1: Agregación por categoría ---
ventas_cat = (df.groupby("categoria", as_index=False)["ventas"]
                .sum()
                .sort_values("ventas", ascending=False))

# --- Paso 2: Cálculo de acumulado y % ---
ventas_cat["acumulado"] = ventas_cat["ventas"].cumsum() ## cumsum calucla la suma acumulada
ventas_cat["porc_acumulado"] = ventas_cat["acumulado"] / ventas_cat["ventas"].sum() * 100

# --- Paso 3: Gráfico 1 ---
fig = go.Figure()

# Barras de ventas
fig.add_trace(go.Bar(
    x=ventas_cat["categoria"],
    y=ventas_cat["ventas"],
    name="Ventas",
    text=ventas_cat["ventas"].map(lambda v: f"${v:,.0f}"),
    textposition="outside",
    marker=dict(line=dict(width=1, color="rgba(0,0,0,0.25)"))
))

# --- Paso 3: Gráfico 2 ---
# Línea de % acumulado
fig.add_trace(go.Scatter(
    x=ventas_cat["categoria"],
    y=ventas_cat["porc_acumulado"],
    name="% acumulado",
    mode="lines+markers",
    yaxis="y2"
))

# --- Layout ---
fig.update_layout(
    title="Gráfico de Pareto de Ventas por Categoría",
    xaxis=dict(title="Categoría"),
    yaxis=dict(title="Ventas"),
    yaxis2=dict(
        title="% Acumulado",
        overlaying="y",
        side="right",
        range=[0, 110]
    ),
    bargap=0.3
)

fig.show()