LIMPIAR AMBOS CSV

In [10]:
import sys
from pathlib import Path
import pandas as pd

# Agregamos la carpeta src al path para poder importar
path_inicio = Path.cwd().parent.parent/"src"
sys.path.append(str(path_inicio))
from utilidades.constantes import MOSTRADOR_SALIDA_PATH, SERVICIOS_SALIDA_PATH, ARCHIVO_MOSTRADOR_FINAL_PATH, ARCHIVO_SERVICIOS_FINAL_PATH

LIMPIO MOSTRADOR

In [None]:
import pandas as pd

# ---------------------------
# 1. Leer archivo consolidado
# ---------------------------

df = pd.read_csv(MOSTRADOR_SALIDA_PATH, encoding='utf-8-sig')

# ---------------------------
# 2. Eliminar ventas anuladas
# ---------------------------
if "Anulado" in df.columns:
    df = df[df["Anulado"].str.lower() == "no"]
else:
    print("No se encontr√≥ columna 'Anulado'.")

# ---------------------------
# 3. Normalizaci√≥n de fechas
# ---------------------------
df['Fecha'] = pd.to_datetime(df['Fecha'], errors='coerce')

# ---------------------------
# 4. Agregar columnas de A√±o y Mes
# ---------------------------
df["anio"] = df["Fecha"].dt.year.astype("Int64")
df["mes"] = df["Fecha"].dt.month.astype("Int64")

# ---------------------------
# 5. Conversi√≥n de n√∫meros
# ---------------------------
df['Cantidad'] = pd.to_numeric(df['Cantidad'], errors='coerce').fillna(0)
df['Precio U'] = pd.to_numeric(df['Precio U'], errors='coerce').fillna(0)

# Subtotal por √≠tem ‚Üí entero
df["subtotal_item"] = (df["Cantidad"] * df["Precio U"]).round().astype("Int64")

# ---------------------------
# 6. Validar columna idVenta
# ---------------------------
if "idVenta" not in df.columns:
    raise ValueError("No existe la columna 'idVenta' en el dataset del mostrador.")

df["idVenta"] = df["idVenta"].astype(str).str.strip()

# ---------------------------
# 7. Recalcular total real por ticket
# ---------------------------
totales = (
    df.groupby("idVenta")["subtotal_item"]
      .sum()
      .reset_index()
      .rename(columns={"subtotal_item": "TotalTicket"})
)

totales["TotalTicket"] = totales["TotalTicket"].round().astype("Int64")

# ---------------------------
# 8. Eliminar TotalVenta repetido
# ---------------------------
if "TotalVenta" in df.columns:
    df = df.drop(columns=["TotalVenta"])

# ---------------------------
# 9. Agregar total correcto por ticket
# ---------------------------
df = df.merge(totales, on="idVenta", how="left")

# ---------------------------
# 10. Seleccionar columnas √∫tiles
# ---------------------------
columnas_utiles = [
    'Fecha', 'anio', 'mes', 'idVenta', 'Producto', 'Cantidad',
    'Cond.Pago', 'Cliente', 'CUIT', 'Impuestos',
    'Neto', 'Precio U', 'subtotal_item', 'TotalTicket'
]

df = df[columnas_utiles]

# ---------------------------
# 11. Clasificaci√≥n de origen
# ---------------------------

decoracion_items = [
    'ALMOHADON', 'APOYA CUCHARA', 'AZUCARERA', 'BANCO TRES PATAS', 'BANCO RECTANGULAR',
    'COLGANTES DE CERAMICA', 'COLGANTES VARIOS', 'CORAZON CHICO', 'CORAZON GRANDE', 'CORAZON MEDIANO',
    'CUENCO CHICO', 'CUENCO MEDIANO', 'CUENCO MINI', 'CUENCO GRANDE', 'JARRA',
    'JARRITO/ MATE/ VASITO', 'JARRO', 'LECHERITA', 'MACETA CHICA', 'MACETA MEDIANA',
    'PINGUINO LITRO', 'PINGUINO MEDIO LITRO', 'PLATO 24CM', 'PLATO 30CM', 'PLATO POSTRE',
    'PORTA CUCHARA GRANDE', 'PORTA VELA', 'POSE TORTA', 'REGALER√çA', 'REGALERIA VARIOS',
    'TAZA SOLA', 'TAZA SOLA ARTESANAL', 'TAZON ARTESANAL', 'TAZON PARA LANA',
    'TELAS', 'TETERA', 'VELA', 'velas', 'TASA CON PLATO MOLDE', 'TAZA CON PLATO ARTESANAL'
]

restobar_items = ['RESTOBAR', 'restovar', 'CONFITERIA', 'Restobar']

decoracion_items = [item.lower() for item in decoracion_items]
restobar_items = [item.lower() for item in restobar_items]


def clasificar_origen(producto):
    producto_lower = str(producto).lower()

    if any(item in producto_lower for item in decoracion_items):
        return 'decoracion'
    elif any(item in producto_lower for item in restobar_items):
        return 'restobar'
    else:
        return 'mostrador'


df['origen'] = df['Producto'].apply(clasificar_origen)

# Gran bloque final: forzar n√∫meros a enteros sin decimales
columnas_enteros = [
    "Cantidad", "Precio U", "subtotal_item", 
    "TotalTicket", "Neto", "Impuestos"
]

for col in columnas_enteros:
    if col in df.columns:
        df[col] = (
            pd.to_numeric(df[col], errors='coerce')
            .fillna(0)
            .round(0)
            .astype("Int64")
        )

# ---------------------------
# 12. Guardar archivo final
# ---------------------------
df.to_csv(ARCHIVO_MOSTRADOR_FINAL_PATH, index=False, encoding='utf-8-sig')
print("Archivo limpio guardado en:", ARCHIVO_MOSTRADOR_FINAL_PATH)

# Vista previa
print(df.head())



ELIMINO EL EFECTO INFLACIONARIO


In [None]:
# ---------- par√°metros ----------
DESTINO_ANIO = 2025
DESTINO_MES  = 10  # 8 = agosto 2025
INCLUIR_MES_ORIGEN = True  # True: multiplica desde el mismo mes; False: desde el mes siguiente
# --------------------------------

# 1) Leer ventas
# Asegurate de que MOSTRADOR_SALIDA_PATH sea un Path (si ya lo es, esta l√≠nea no rompe)
ARCHIVO_MOSTRADOR_FINAL_PATH = Path(ARCHIVO_MOSTRADOR_FINAL_PATH)

df = pd.read_csv(ARCHIVO_MOSTRADOR_FINAL_PATH, parse_dates=['Fecha'])
df['Anio'] = df['Fecha'].dt.year
df['Mes']  = df['Fecha'].dt.month

# 2) Inflaci√≥n mensual en % (ene/2023 ‚Üí ago/2025)
inflaciones_pct = [
    # 2023
    6.0, 6.6, 7.7, 8.4, 7.8, 6.0, 6.3, 12.4, 12.7, 8.3, 12.8, 25.5,
    # 2024
    20.6, 13.2, 11.0, 8.8, 4.2, 4.6, 4.0, 4.2, 3.5, 2.7, 2.4, 2.7,
    # 2025 (ene‚Äìago)
    2.2, 2.4, 3.7, 2.8, 1.5, 1.6, 1.9, 1.9, 2.1, 2.1
]
infl = [x/100 for x in inflaciones_pct]

# 3) Tabla de meses (ene/2023 ‚Üí ago/2025)
anios = [2023]*12 + [2024]*12 + [2025]*10
meses = list(range(1,13)) + list(range(1,13)) + list(range(1,11))
tbl = pd.DataFrame({'Anio': anios, 'Mes': meses, 'inf': infl})

# √çndice del destino
idx_dest = tbl.index[(tbl.Anio == DESTINO_ANIO) & (tbl.Mes == DESTINO_MES)][0]

# 4) Coeficiente: prod (1+inf_j) desde j_start hasta destino
coef = []
for i in range(len(tbl)):
    if i > idx_dest:
        coef.append(float('nan'))    # no ajustamos posterior al destino
        continue
    j_start = i if INCLUIR_MES_ORIGEN else i+1
    f = 1.0
    for j in range(j_start, idx_dest+1):
        f *= (1 + tbl.loc[j, 'inf'])
    coef.append(f)

tbl['Coef_Ajuste'] = coef

# 5) Merge y ajuste
df = df.merge(tbl[['Anio','Mes','Coef_Ajuste']], on=['Anio','Mes'], how='left')
df['TotalVenta_Ajustado'] = (df['TotalVenta'] * df['Coef_Ajuste']).round(0).astype('Int64')

# 6) Guardar a archivo NUEVO (misma carpeta, nombre con sufijo)
SALIDA = ARCHIVO_MOSTRADOR_FINAL_PATH.parent / f"ventas_mostrador_final.csv"
df.to_csv(SALIDA, index=False, encoding="utf-8-sig")
print(f"Dataset ajustado a precios de {DESTINO_MES:02d}/{DESTINO_ANIO}: {SALIDA}")


LIMPIO SERVICIOS

In [12]:
import pandas as pd
from pathlib import Path

# 1) Leer ventas
df = pd.read_csv(SERVICIOS_SALIDA_PATH, parse_dates=['fecha_emision'])

# 2) Normalizar tipos
df['tipo_comprobante'] = df['tipo_comprobante'].astype(str)

# 3) Invertir signo SOLO para Notas de Cr√©dito
codigos_nc = ['3','8','13','203']
df.loc[df['tipo_comprobante'].isin(codigos_nc), 'importe_total'] *= -1

# 4) Crear columnas Anio y Mes
df['Anio'] = df['fecha_emision'].dt.year
df['Mes']  = df['fecha_emision'].dt.month

# 5) Guardar archivo final
SERVICIOS_SALIDA_PATH = Path(ARCHIVO_SERVICIOS_FINAL_PATH)
SALIDA = SERVICIOS_SALIDA_PATH.parent / "ventas_servicios_final.csv"
df.to_csv(SALIDA, index=False, encoding='utf-8-sig')

print("‚úÖ Archivo generado:", SALIDA)
print("   Notas de cr√©dito puestas en negativo.")
print("   Columnas 'Anio' y 'Mes' agregadas correctamente.")



‚úÖ Archivo generado: ..\..\3_data_final\ventas_servicios_final.csv
   Notas de cr√©dito puestas en negativo.
   Columnas 'Anio' y 'Mes' agregadas correctamente.


In [None]:
import pandas as pd
import numpy as np
from pathlib import Path

# ---------- Par√°metros ----------
DESTINO_ANIO  = 2025
DESTINO_MES   = 10    # 9 = septiembre 2025
INCLUIR_MES_ORIGEN = True  # True => multiplica desde el mismo mes; False => desde el mes siguiente
# --------------------------------

# 1) Leer ventas
df = pd.read_csv(SERVICIOS_SALIDA_PATH, parse_dates=['fecha_emision'])

# 2) Normalizar tipos / signos (si aplica para tu dataset)
df['tipo_comprobante'] = df['tipo_comprobante'].astype(str)
df.loc[df['tipo_comprobante'].isin(['3','8','203']), 'importe_total'] *= -1

# 3) Mes y a√±o base
df['Anio'] = df['fecha_emision'].dt.year
df['Mes']  = df['fecha_emision'].dt.month

# 4) Inflaci√≥n mensual en %
inflaciones_pct = [
    # 2023
    6.0, 6.6, 7.7, 8.4, 7.8, 6.0, 6.3, 12.4, 12.7, 8.3, 12.8, 25.5,
    # 2024
    20.6, 13.2, 11.0, 8.8, 4.2, 4.6, 4.0, 4.2, 3.5, 2.7, 2.4, 2.7,
    # 2025 (ene‚Äìago)
    2.2, 2.4, 3.7, 2.8, 1.5, 1.6, 1.9, 1.9, 2.1, 2.1
]
infl = [x/100 for x in inflaciones_pct]

# 5) Tabla cronol√≥gica (ene/2023 ‚Üí ago/2025)
anios = [2023]*12 + [2024]*12 + [2025]*10
meses = list(range(1,13)) + list(range(1,13)) + list(range(1,11))
tbl = pd.DataFrame({'Anio': anios, 'Mes': meses, 'inf': infl})

# 6) √çndice del destino
idx_dest = tbl.index[(tbl['Anio']==DESTINO_ANIO) & (tbl['Mes']==DESTINO_MES)][0]

# 7) Calcular coeficientes acumulados hasta destino
coef = []
for i in range(len(tbl)):
    if i > idx_dest:
        coef.append(float('nan'))
        continue
    j_start = i if INCLUIR_MES_ORIGEN else i+1
    f = np.prod(1 + tbl.loc[j_start:idx_dest, 'inf'])
    coef.append(round(f, 6))
tbl['Coef_Ajuste'] = coef

# ==============================================================
# üîç Emparejar notas de cr√©dito con ventas (por CUIT y monto)
# ==============================================================

ventas = df[~df['tipo_comprobante'].isin(['3','8','203'])].copy()
ncs    = df[df['tipo_comprobante'].isin(['3','8','203'])].copy()

ventas['fecha_emision'] = pd.to_datetime(ventas['fecha_emision'])
ncs['fecha_emision']    = pd.to_datetime(ncs['fecha_emision'])

if 'cuit_receptor' not in df.columns:
    raise ValueError("No existe la columna 'cuit_receptor' en el dataset.")

# Inicializar columnas
ncs['Anio_ajuste'] = ncs['Anio']
ncs['Mes_ajuste']  = ncs['Mes']

ventas = ventas.sort_values(['cuit_receptor','fecha_emision'])
ncs    = ncs.sort_values(['cuit_receptor','fecha_emision'])

for idx, row in ncs.iterrows():
    cuit = row['cuit_receptor']
    monto_nc = abs(row['importe_total'])
    fecha_nc = row['fecha_emision']

    # Ventas del mismo CUIT, anteriores o del mismo d√≠a
    subset = ventas[(ventas['cuit_receptor'] == cuit) & (ventas['fecha_emision'] <= fecha_nc)]
    if subset.empty:
        continue

    subset = subset.copy()
    subset['diff'] = (subset['importe_total'] - monto_nc).abs()

    # 1Ô∏è‚É£ Intentar coincidencia exacta de monto
    exact_match = subset[subset['diff'] == 0]
    if not exact_match.empty:
        venta_match = exact_match.sort_values('fecha_emision').iloc[-1]  # la √∫ltima venta igual
    else:
        # 2Ô∏è‚É£ Si no hay exacta, elegir la m√°s cercana
        venta_match = subset.sort_values(['diff','fecha_emision']).iloc[0]

    # Asignar mes/a√±o de esa venta
    ncs.at[idx, 'Anio_ajuste'] = venta_match['fecha_emision'].year
    ncs.at[idx, 'Mes_ajuste']  = venta_match['fecha_emision'].month

# Unir ventas + NCs
df = pd.concat([ventas, ncs], ignore_index=True)

# ==============================================================
# üî¢ Merge con tabla de inflaci√≥n y ajuste de montos
# ==============================================================
# Asegurar que todas las filas tengan Anio_ajuste y Mes_ajuste
df['Anio_ajuste'] = df['Anio_ajuste'].fillna(df['Anio'])
df['Mes_ajuste']  = df['Mes_ajuste'].fillna(df['Mes'])

df = df.merge(
    tbl[['Anio','Mes','Coef_Ajuste']],
    left_on=['Anio_ajuste','Mes_ajuste'],
    right_on=['Anio','Mes'],
    how='left',
    suffixes=('_emitido','_real')
)

# Limpiar columnas duplicadas
df = df.rename(columns={
    'Anio_emitido': 'Anio',
    'Mes_emitido': 'Mes'
})
df = df.drop(columns=['Anio_real','Mes_real'], errors='ignore')

# Ajustar todos los montos (ventas y NC)
df['TotalVenta_Ajustado'] = (df['importe_total'] * df['Coef_Ajuste']).round(0).astype('Int64')

# ==============================================================
# üíæ Guardar resultado
# ==============================================================

SERVICIOS_SALIDA_PATH = Path(ARCHIVO_SERVICIOS_FINAL_PATH)
SALIDA = SERVICIOS_SALIDA_PATH.parent / "ventas_servicios_final.csv"
df.to_csv(SALIDA, index=False, encoding='utf-8-sig')

print(f"‚úÖ Dataset ajustado guardado como {SALIDA}")
print(f"   Ajustado a precios de {DESTINO_MES:02d}/{DESTINO_ANIO}")
