# Ventas vs Gastos Mensuales (2024-01 a 2025-05)

Este notebook permite visualizar la comparación mensual entre las ventas (ingresos) y los gastos de la empresa desde enero 2024 hasta mayo 2025.

## 1. Importar Librerías y Conectar a la Base de Datos

Importamos las librerías necesarias y establecemos la conexión a la base de datos para extraer los datos de ventas y gastos.

In [None]:
import pandas as pd
import numpy as np
from sqlalchemy import create_engine
from urllib.parse import quote_plus
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Configuración de conexión (ajusta según tus credenciales)
usuario = "root"
contraseña = "3112708652El"
host = "localhost"
puerto = 3306
basededatos = "demo_wft"

contraseña_escapada = quote_plus(contraseña)
engine = create_engine(f"mysql+pymysql://{usuario}:{contraseña_escapada}@{host}:{puerto}/{basededatos}")

## 2. Obtener y Procesar Datos de Ingresos Mensuales (Ventas)

Consultamos y agrupamos los ingresos mensuales por ventas desde enero 2024 hasta mayo 2025. Nos aseguramos de que cada mes esté representado, aunque no haya ventas.

In [None]:
# Consulta de ingresos mensuales por ventas
query_ingresos = """
SELECT 
    DATE_FORMAT(d.fecha, '%Y-%m-01') AS mes,
    SUM(di.total) AS ingresos
FROM documents d
JOIN document_items di ON d.id = di.document_id
WHERE d.tipo = 'venta'
  AND d.fecha BETWEEN '2024-01-01' AND '2025-05-31'
GROUP BY mes
ORDER BY mes
"""

df_ingresos = pd.read_sql(query_ingresos, engine)
df_ingresos['mes'] = pd.to_datetime(df_ingresos['mes'])
df_ingresos['ingresos'] = pd.to_numeric(df_ingresos['ingresos'], errors='coerce').fillna(0)

# Generar rango completo de meses
rango_meses = pd.date_range(start='2024-01-01', end='2025-05-01', freq='MS')
df_meses = pd.DataFrame({'mes': rango_meses})

# Unir para asegurar que todos los meses estén presentes
df_ingresos = pd.merge(df_meses, df_ingresos, on='mes', how='left')
df_ingresos['ingresos'] = df_ingresos['ingresos'].fillna(0)

## 3. Obtener y Procesar Datos de Gastos Mensuales

Consultamos y agrupamos los gastos mensuales de la empresa desde enero 2024 hasta mayo 2025. Nos aseguramos de que cada mes esté representado, aunque no haya gastos.

In [None]:
# Consulta de gastos mensuales (ajusta la tabla y columnas según tu modelo de datos)
query_gastos = """
SELECT 
    DATE_FORMAT(fecha, '%Y-%m-01') AS mes,
    SUM(monto) AS gastos
FROM gastos
WHERE fecha BETWEEN '2024-01-01' AND '2025-05-31'
GROUP BY mes
ORDER BY mes
"""

df_gastos = pd.read_sql(query_gastos, engine)
df_gastos['mes'] = pd.to_datetime(df_gastos['mes'])
df_gastos['gastos'] = pd.to_numeric(df_gastos['gastos'], errors='coerce').fillna(0)

# Unir para asegurar que todos los meses estén presentes
df_gastos = pd.merge(df_meses, df_gastos, on='mes', how='left')
df_gastos['gastos'] = df_gastos['gastos'].fillna(0)

## 4. Unir Ingresos y Gastos por Mes

Realizamos un merge externo entre los DataFrames de ingresos y gastos para tener ambos valores por cada mes, rellenando valores faltantes con 0.

In [None]:
# Unir ingresos y gastos por mes
df_ventas_gastos = pd.merge(df_ingresos, df_gastos, on='mes', how='outer')
df_ventas_gastos = df_ventas_gastos.fillna(0)

## 5. Graficar Ventas vs Gastos por Mes (2024-01 a 2025-05)

Creamos una gráfica de barras agrupadas usando Plotly, donde cada mes tiene una barra para ventas y otra para gastos, mostrando claramente la comparación mensual.

In [None]:
fig = go.Figure(data=[
    go.Bar(
        x=df_ventas_gastos['mes'],
        y=df_ventas_gastos['ingresos'],
        name='Ventas',
        marker_color='#28a745'
    ),
    go.Bar(
        x=df_ventas_gastos['mes'],
        y=df_ventas_gastos['gastos'],
        name='Gastos',
        marker_color='#dc3545'
    )
])

fig.update_layout(
    barmode='group',
    title='Ventas vs Gastos Mensuales (2024-01 a 2025-05)',
    xaxis_title='Mes',
    yaxis_title='Monto ($)',
    template='plotly_white',
    xaxis=dict(
        tickformat='%b %Y',
        tickvals=df_ventas_gastos['mes'],
        tickangle=45
    )
)

fig.show()