# Clase: Introducción a Estadística Descriptiva y Visualización de Datos con Plotly y Pandas
## Profesor: Kevin Sossa
## Estudiante: 

> **Objetivo** : Proveer a los estudiantes herramientas para calcular estadísticas descriptivas y crear visualizaciones interactivas con Plotly y Pandas.

# Estadística descriptiva:
- Medidas de tendencia central (media, mediana, moda)
- y dispersión (varianza, desviación estándar).

In [1]:
import pandas as pd

df = pd.read_csv('us_electricity_data.csv')
print(df.head())
print(df.info())


FileNotFoundError: [Errno 2] No such file or directory: 'us_electricity_data.csv'

-Calcular estadísticas básicas:



In [None]:
print("Media de ventas:", df['sales'].mean())
print("Mediana de ingresos:", df['revenue'].median())
print("Desviación estándar de precios:", df['price'].std())


### Actividad práctica inicial:
- En equipos, calcular las estadísticas descriptivas de las columnas sales y price por estado (stateDescription).
- Identificar estados con mayor y menor promedio de consumo (sales).

## Fundamentos de Plotly
¿Qué es Plotly?
- Librería de visualización interactiva en Python.
- Ideal para gráficos como líneas, barras, dispersión y mapas.

In [None]:
# Instalación y configuración básica:
!pip install plotly
import plotly.express as px


In [None]:
#Primer gráfico: Dispersión de ventas vs. ingresos:
fig = px.scatter(df, x='sales', y='revenue', color='stateDescription', title="Ventas vs Ingresos por Estado")
fig.show()


- Crear un gráfico de barras que muestre las ventas totales por sector (sectorName)

Histogramas:

Distribución de precios de electricidad

In [None]:
fig = px.histogram(df, x='price', nbins=20, title="Distribución de Precios de Electricidad")
fig.show()


Gráficos de líneas:

Tendencia de ventas por año

In [None]:
ventas_por_año = df.groupby('year')['sales'].sum().reset_index()
fig = px.line(ventas_por_año, x='year', y='sales', title="Tendencia de Ventas por Año")
fig.show()


Crear un gráfico de líneas que muestre la evolución del precio promedio (price) por año para el sector residencial (sectorName == 'Residential').

### Taller Final de Práctica 

- Ejercicio 1: Comparación por Sector.
Crear un gráfico de barras que compare el ingreso promedio (revenue) por sector.

- Ejercicio 2: Tendencia de Ventas en Estados Clave.
Seleccionar 3 estados clave y crear un gráfico de líneas con la tendencia de ventas (sales) por año.

- Ejercicio 3: Distribución de Clientes por Sector.
Crear un histograma que muestre la distribución del número de clientes (customers) por sector.

- Ejercicio 4: Interactividad con Filtros.
Usar Plotly Express para crear un gráfico que permita filtrar ventas (sales) por estado y sector.

Para exportar gráficos creados con **Plotly** a un archivo de Excel, puedes usar la biblioteca **`openpyxl`** junto con **`Pandas`**. :

---

### **Código para exportar gráficos de Plotly a Excel**
```python
import pandas as pd
import plotly.express as px
from openpyxl import Workbook
from openpyxl.drawing.image import Image
import plotly.io as pio

# Crear un DataFrame de ejemplo
df = pd.DataFrame({
    'Mes': ['Enero', 'Febrero', 'Marzo', 'Abril'],
    'Ventas': [150, 200, 250, 300]
})

# Crear un gráfico con Plotly
fig = px.bar(df, x='Mes', y='Ventas', title='Ventas Mensuales', labels={'Ventas': 'Cantidad'})

# Guardar el gráfico como imagen
fig_path = "grafico_plotly.png"
pio.write_image(fig, fig_path, format='png', width=800, height=400)

# Crear un archivo Excel con openpyxl
wb = Workbook()
ws = wb.active
ws.title = "Datos y Gráfica"

# Agregar datos al Excel
for i, col in enumerate(df.columns, start=1):
    ws.cell(row=1, column=i, value=col)

for i, row in enumerate(df.itertuples(index=False), start=2):
    for j, value in enumerate(row, start=1):
        ws.cell(row=i, column=j, value=value)

# Insertar la imagen del gráfico en Excel
img = Image(fig_path)
img.anchor = "E2"  # Posición en la hoja
ws.add_image(img)

# Guardar el archivo Excel
excel_path = "datos_con_grafico.xlsx"
wb.save(excel_path)
print(f"Archivo Excel guardado en {excel_path}")
```

---

### **Explicación del código**:
1. **Crear el gráfico**:
   - Se usa Plotly Express para generar un gráfico de barras (`fig`).
   - Se guarda el gráfico como imagen en formato PNG usando `pio.write_image`.

2. **Agregar datos a Excel**:
   - Utilizamos `openpyxl` para crear un archivo Excel.
   - Los datos del DataFrame se escriben celda por celda en la hoja de cálculo.

3. **Insertar la imagen en Excel**:
   - La imagen del gráfico se carga con `Image` y se posiciona en una celda específica (`E2` en este caso).
   - Finalmente, se guarda el archivo Excel.

---

### **Salida**:
El archivo Excel generado incluirá:
1. **Datos**: Los datos tabulares en las columnas iniciales.
2. **Gráfico**: El gráfico de Plotly insertado como imagen en la hoja.

---

### **Requisitos adicionales**:
Para guardar imágenes desde Plotly, debes instalar `kaleido`:
```bash
pip install -U kaleido
```

