# Análisis Exploratorio de Correos

Programa para obtener datos de volumen y distribución temporal de correos que ayuden a reforzar la calidad de Atención al cliente de la empresa.

In [None]:
import pandas as pd
import requests
from sqlalchemy import create_engine

## Carga de datos

In [None]:

# conectar a MySQL
engine = create_engine("mysql+pymysql://root:root@localhost:3306/atc")
df = pd.read_sql("SELECT id, client_id, fecha_envio, email FROM emails", con=engine)

# convertir fechas
df['fecha_envio'] = pd.to_datetime(df['fecha_envio'], errors='coerce')

## Analisis de distribución de categorías

In [None]:
# clasificar cada email llamando a la API
categorias = []
for idx, row in df.iterrows():
    try:
        response = requests.post(
            "http://localhost:8000/classify-email",
            json={
                "client_id": int(row["client_id"]),
                "fecha_envio": str(row["fecha_envio"]),
                "email_body": row["email"]
                }
        )
        response.raise_for_status()
        categorias.append(response.json()["prediccion"])
    except Exception as e:
        # print(f"Error clasificando id={row['id']}: {e}")
        categorias.append("cliente con impagos")

df["categoria"] = categorias

## Exploración del volumen de correos por categoría

In [None]:
# volumen por categoría
print("\n=== Volumen de correos por categoría ===")
print(df['categoria'].value_counts())

In [None]:
=== Volumen de correos por categoría ===
categoria
facturacion            21
cliente con impagos    16
contrato                9
otros                   7
altas y bajas           4
tarifas                 3
incidencia              3

## Distribución temporal de correos

In [None]:
df['mes'] = df['fecha_envio'].dt.to_period('M')
print("\n=== Distribución temporal de correos por mes ===")
print(df.groupby(['mes']).size())
print("\n=== Distribución temporal de correos por categoría (mensual) ===")
print(df.groupby(['mes', 'categoria']).size())

# distribución por día de la semana
df['dia_semana'] = df['fecha_envio'].dt.day_name()
print("\n=== Distribución de correos por día de la semana ===")
print(df.groupby(['dia_semana']).size())
print("\n=== Distribución de correos por categoría (diaria) ===")
print(df.groupby(['dia_semana', 'categoria']).size())


In [None]:
=== Distribución temporal de correos por mes ===
mes
2022-01    2
2022-02    1
2022-03    2
2022-04    3
2022-05    4
2022-06    2
2022-07    1
2022-08    6
...

In [None]:
=== Distribución temporal de correos por categoría (mensual) ===
mes      categoria          
2022-01  cliente con impagos    1
         contrato               1
2022-02  contrato               1
2022-03  cliente con impagos    1
         facturacion            1
...

In [None]:
=== Distribución de correos por día de la semana ===
dia_semana
Friday       11
Monday        7
Saturday      7
Sunday        7
Thursday     11
Tuesday       6
Wednesday    14

In [None]:
=== Distribución de correos por día de la semana ===
dia_semana  categoria          
Friday      altas y bajas          1
            cliente con impagos    3
            contrato               3
            facturacion            2
            otros                  1
            tarifas                1
Monday      altas y bajas          1
            cliente con impagos    3
            contrato               1
            facturacion            2
...

## Ejecucion del programa analisis.py

In [None]:
python analisis.py

# Recomendaciones
# - Asegurarse de que la API de clasificación esté corriendo en el puerto 8000 antes de ejecutar el script.
# - Tener todos paquetes y librerías necesarios instalados. De ser necesario, instalar con venv o pip.

## Recomendaciones

- **Estrategias de recursos**: Dado el volumen alto de consultas en *facturación* y *contratos*, priorizar agentes especializados en estos temas podría mejorar tiempos de respuesta.
- **Capacitación**: Se recomienda formación adicional para el equipo sobre procesos de facturación y alta de servicios, ya que son las áreas con más demanda.
- **Medidas preventivas**: Mejorar la documentación de facturas y contratos en el área cliente de la web/app, y enviar notificaciones automáticas cuando se generen nuevos contratos o facturas, podría reducir gran parte de los correos recurrentes.
- **Estacionalidad**: Si se confirma un pico mensual, reforzar personal en esas fechas puede mitigar saturaciones puntuales. Y semanalmente, los días con más tráfico son de miércoles a viernes, estudiar refuerzos quizá a media jornada para ese tramo.