# 7_VARIABLE ALEATORIA

### Correos electrónicos


In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Datos de correos por hora
horas = [f"{i}:00" for i in range(8, 18)]  # Horario laboral
correos_hora = [5, 12, 8, 7, 9, 11, 6, 8, 10, 7]

# Tamaño del gráfico
plt.figure(figsize=(15, 10))

# Subplot 1: Gráfico de barras
plt.subplot(2, 2, 1)
plt.bar(horas, correos_hora)
plt.title("Correos por Hora")
plt.xlabel("Hora del día")
plt.ylabel("Número de correos")
plt.xticks(rotation=45)

# Subplot 2: Gráfico de línea con puntos
plt.subplot(2, 2, 2)
plt.plot(horas, correos_hora, "bo-")
plt.title("Tendencia de Correos")
plt.xlabel("Hora del día")
plt.ylabel("Número de correos")
plt.xticks(rotation=45)
plt.grid(True)

# Subplot 3: Gráfico de calor horizontal
plt.subplot(2, 2, 3)
plt.imshow([correos_hora], cmap="YlOrRd", aspect="auto")
plt.colorbar(label="Número de correos")
plt.yticks([])
plt.xticks(range(len(horas)), horas, rotation=45)
plt.title("Mapa de Calor de Actividad")

# Subplot 4: Gráfico de barras con estadísticas
plt.subplot(2, 2, 4)
plt.bar(horas, correos_hora)
plt.axhline(y=np.mean(correos_hora), color="r", linestyle="--", label="Media")
plt.axhline(y=np.median(correos_hora), color="g", linestyle="--", label="Mediana")
plt.title("Correos con Estadísticas")
plt.xlabel("Hora del día")
plt.ylabel("Número de correos")
plt.xticks(rotation=45)
plt.legend()

plt.tight_layout()
plt.show()

# Análisis estadístico
print("=== Análisis de Correos por Hora ===")
print(f"\nTotal de correos: {sum(correos_hora)}")
print(f"Promedio de correos por hora: {np.mean(correos_hora):.1f}")
print(f"Mediana de correos por hora: {np.median(correos_hora)}")
print(f"Desviación estándar: {np.std(correos_hora):.2f}")
print(
    f"Hora más ocupada: {horas[np.argmax(correos_hora)]} ({max(correos_hora)} correos)"
)
print(
    f"Hora menos ocupada: {horas[np.argmin(correos_hora)]} ({min(correos_hora)} correos)"
)

# Análisis de carga de trabajo
print("\n=== Análisis de Carga de Trabajo ===")
horas_ordenadas = [x for _, x in sorted(zip(correos_hora, horas), reverse=True)]
correos_ordenados = sorted(correos_hora, reverse=True)

print("\nHoras ordenadas por volumen de correos:")
for hora, correos in zip(horas_ordenadas, correos_ordenados):
    carga = (
        "Alta"
        if correos >= np.percentile(correos_hora, 75)
        else "Media" if correos >= np.percentile(correos_hora, 25) else "Baja"
    )
    print(f"Hora {hora}: {correos} correos - Carga {carga}")

# Distribución por períodos
manana = correos_hora[:3]  # 8:00-10:00
medio_dia = correos_hora[3:6]  # 11:00-13:00
tarde = correos_hora[6:]  # 14:00-17:00

print("\n=== Distribución por Períodos ===")
print(
    f"Mañana (8:00-10:00): {sum(manana)} correos ({sum(manana)/sum(correos_hora)*100:.1f}%)"
)
print(
    f"Medio día (11:00-13:00): {sum(medio_dia)} correos ({sum(medio_dia)/sum(correos_hora)*100:.1f}%)"
)
print(
    f"Tarde (14:00-17:00): {sum(tarde)} correos ({sum(tarde)/sum(correos_hora)*100:.1f}%)"
)

# Recomendaciones basadas en los datos
print("\n=== Recomendaciones ===")
max_hora = horas[np.argmax(correos_hora)]
print(f"1. Reforzar personal a las {max_hora} (hora pico)")
if np.mean(manana) > np.mean(tarde):
    print("2. Priorizar personal en horario matutino")
else:
    print("2. Priorizar personal en horario vespertino")
print(
    f"3. Considerar automatización para horas de baja carga ({horas[np.argmin(correos_hora)]})"
)

### Bugs por revisión de código

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Número de bugs encontrados por revisión de código
bugs_revision = [0, 2, 1, 3, 0, 1, 2, 1, 0, 1, 2, 3, 1, 0, 2]
valores, frecuencias = np.unique(bugs_revision, return_counts=True)
frecuencias_relativas = frecuencias / len(bugs_revision)

# Crear la gráfica
plt.figure(figsize=(8, 5))

# Gráfico de barras
plt.bar(
    valores, frecuencias_relativas, color="skyblue", edgecolor="darkblue", width=0.5
)

# Añadir etiquetas a las barras
for i, (valor, freq) in enumerate(zip(valores, frecuencias_relativas)):
    plt.text(valor, freq + 0.01, f"{freq:.3f}", ha="center")

# Etiquetas y título
plt.xlabel("Número de bugs")
plt.ylabel("Frecuencia relativa")
plt.title("Distribución de bugs encontrados por revisión de código")
plt.xticks(valores)
plt.ylim(0, max(frecuencias_relativas) + 0.1)  # Espacio para las etiquetas

# Añadir grid para mejor visualización
plt.grid(axis="y", linestyle="--", alpha=0.7)

plt.show()
print()
# Representación alternativa: gráfico de pastel
plt.figure(figsize=(6, 6))
etiquetas = [f"{v} bugs" for v in valores]
plt.pie(
    frecuencias,
    labels=etiquetas,
    autopct="%1.1f%%",
    colors=["lightgreen", "skyblue", "lightcoral", "gold"],
    shadow=True,
    startangle=90,
)
plt.axis("equal")
plt.title("Porcentaje de revisiones por cantidad de bugs encontrados")

plt.show()

## Variables aleatorias continuas
### Consumo de energía por hora (kwh)

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

# Datos de consumo de energía
consumo_energia = [
    5.2,
    4.8,
    5.1,
    5.3,
    4.9,
    5.0,
    5.2,
    4.7,
    5.1,
    5.5,
    4.8,
    5.2,
    5.0,
    4.9,
    5.1,
    5.3,
    4.8,
    5.0,
    5.2,
    4.9,
]

# Estadísticas básicas
media = np.mean(consumo_energia)
minimo = min(consumo_energia)
maximo = max(consumo_energia)
desviacion = np.std(consumo_energia)

# Crear figura con subplots
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 6))

# Histograma con curva de densidad
ax1.hist(
    consumo_energia, bins=6, density=True, alpha=0.7, color="skyblue", edgecolor="black"
)

# Añadir curva de densidad (estimación KDE)
x = np.linspace(minimo - 0.2, maximo + 0.2, 100)
kde = stats.gaussian_kde(consumo_energia)
ax1.plot(x, kde(x), "r-", linewidth=2)

# Añadir línea vertical para la media
ax1.axvline(
    x=media, color="green", linestyle="--", linewidth=2, label=f"Media: {media:.2f} kWh"
)

# Configuración del primer gráfico
ax1.set_title("Distribución del consumo de energía")
ax1.set_xlabel("Consumo (kWh)")
ax1.set_ylabel("Densidad")
ax1.grid(alpha=0.3)
ax1.legend()

# Gráfico de violín con boxplot
ax2.violinplot(consumo_energia, showmeans=True, showmedians=True)
ax2.boxplot(
    consumo_energia,
    positions=[1],
    widths=0.3,
    patch_artist=True,
    boxprops=dict(facecolor="lightgreen", alpha=0.5),
)

# Etiquetas para estadísticas
stats_text = (
    f"Media: {media:.2f} kWh\n"
    f"Mínimo: {minimo:.2f} kWh\n"
    f"Máximo: {maximo:.2f} kWh\n"
    f"Desv. estándar: {desviacion:.3f}"
)
ax2.text(1.3, media, stats_text, bbox=dict(facecolor="white", alpha=0.8))

# Configuración del segundo gráfico
ax2.set_title("Análisis estadístico del consumo")
ax2.set_ylabel("Consumo (kWh)")
ax2.set_xticks([1])
ax2.set_xticklabels(["Consumo"])
ax2.set_ylim(minimo - 0.2, maximo + 0.2)
ax2.grid(axis="y", alpha=0.3)

plt.tight_layout()
plt.show()

# Serie temporal (suponiendo mediciones secuenciales)
plt.figure(figsize=(12, 5))
plt.plot(
    range(1, len(consumo_energia) + 1),
    consumo_energia,
    marker="o",
    linestyle="-",
    color="blue",
    markersize=6,
)
plt.axhline(y=media, color="r", linestyle="--", label=f"Media: {media:.2f} kWh")
plt.fill_between(
    range(1, len(consumo_energia) + 1),
    minimo,
    maximo,
    alpha=0.1,
    color="gray",
    label=f"Rango: {minimo:.1f}-{maximo:.1f} kWh",
)

plt.title("Consumo de energía a lo largo del tiempo")
plt.xlabel("Medición")
plt.ylabel("Consumo (kWh)")
plt.grid(True, alpha=0.3)
plt.legend()
plt.tight_layout()
plt.show()

### Control de calidad en línea de envasado

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Peso de paquetes en línea de producción (kg)
print("Peso de paquetes:")
peso_paquetes = [
    10.2,
    9.8,
    10.1,
    10.3,
    10,
    10.0,
    10.2,
    9.7,
    10.1,
    10.4,
    9.8,
    10.2,
    10.0,
    9.9,
    10.1,
    10.6,
    9.8,
    10.0,
    10.2,
    9.9,
]
print(f"Peso medio: {np.mean(peso_paquetes):.2f}kg")
print(f"Peso mínimo: {min(peso_paquetes):.2f}kg")
print(f"Peso máximo: {max(peso_paquetes):.2f}kg")

# Configuración del estilo de la gráfica
plt.figure(figsize=(12, 8))
sns.set_style("whitegrid")

# Crear subplots para diferentes visualizaciones
fig, axs = plt.subplots(2, 2, figsize=(14, 10))
fig.suptitle("Análisis del Peso de Paquetes en Línea de Producción", fontsize=16)

# 1. Histograma con curva de densidad
sns.histplot(peso_paquetes, kde=True, color="skyblue", ax=axs[0, 0])
axs[0, 0].axvline(
    np.mean(peso_paquetes),
    color="red",
    linestyle="--",
    linewidth=2,
    label=f"Media: {np.mean(peso_paquetes):.2f}kg",
)
axs[0, 0].axvline(
    np.median(peso_paquetes),
    color="green",
    linestyle="-.",
    linewidth=2,
    label=f"Mediana: {np.median(peso_paquetes):.2f}kg",
)
axs[0, 0].set_title("Distribución del Peso de Paquetes")
axs[0, 0].set_xlabel("Peso (kg)")
axs[0, 0].set_ylabel("Frecuencia")
axs[0, 0].legend()

# 2. Gráfico de caja (boxplot)
sns.boxplot(y=peso_paquetes, ax=axs[0, 1], color="lightgreen")
axs[0, 1].set_title("Boxplot del Peso de Paquetes")
axs[0, 1].set_ylabel("Peso (kg)")

# 3. Gráfico de línea para ver la secuencia
axs[1, 0].plot(
    range(1, len(peso_paquetes) + 1),
    peso_paquetes,
    marker="o",
    linestyle="-",
    color="purple",
)
axs[1, 0].axhline(y=10.0, color="blue", linestyle="--", label="Peso objetivo (10.0 kg)")
axs[1, 0].axhline(
    y=np.mean(peso_paquetes),
    color="red",
    linestyle="-.",
    label=f"Media: {np.mean(peso_paquetes):.2f}kg",
)
axs[1, 0].set_title("Secuencia de Pesos por Paquete")
axs[1, 0].set_xlabel("Número de Paquete")
axs[1, 0].set_ylabel("Peso (kg)")
axs[1, 0].set_xticks(range(1, len(peso_paquetes) + 1))
axs[1, 0].grid(True)
axs[1, 0].legend()

# 4. Gráfico de barras de desviación respecto al peso objetivo (en lugar del violin plot)
desviaciones = [p - 10.0 for p in peso_paquetes]
bars = axs[1, 1].bar(
    range(1, len(peso_paquetes) + 1),
    desviaciones,
    color=["red" if d < 0 else "green" for d in desviaciones],
)
axs[1, 1].axhline(y=0, color="black", linestyle="-", linewidth=1)
axs[1, 1].set_title("Desviación respecto al Peso Objetivo (10 kg)")
axs[1, 1].set_xlabel("Número de Paquete")
axs[1, 1].set_ylabel("Desviación (kg)")
axs[1, 1].set_xticks(range(1, len(peso_paquetes) + 1))
axs[1, 1].grid(True, axis="y")

# Añadir valores encima de las barras
for i, v in enumerate(desviaciones):
    axs[1, 1].text(
        i + 1, v + (0.01 if v >= 0 else -0.03), f"{v:.1f}", ha="center", fontsize=8
    )

# Añadir estadísticas como anotaciones en el gráfico
stats_text = f"""
Estadísticas:
- Media: {np.mean(peso_paquetes):.2f} kg
- Mediana: {np.median(peso_paquetes):.2f} kg
- Desv. Estándar: {np.std(peso_paquetes):.3f} kg
- Mínimo: {min(peso_paquetes):.2f} kg
- Máximo: {max(peso_paquetes):.2f} kg
- Rango: {max(peso_paquetes) - min(peso_paquetes):.2f} kg
- CV: {(np.std(peso_paquetes)/np.mean(peso_paquetes)*100):.2f}%
"""

# Añadir texto con estadísticas
fig.text(
    0.5,
    0.02,
    stats_text,
    ha="center",
    va="center",
    bbox=dict(facecolor="lightyellow", alpha=0.5),
)

# Ajustar el layout
plt.tight_layout(rect=[0, 0.03, 1, 0.95])
plt.subplots_adjust(bottom=0.15)

# Mostrar el gráfico
plt.show()