In [1]:
from datetime import date, timedelta, datetime
import pandas as pd
import numpy as np

# --- Fechas ---
weeks = 100


In [2]:
import xmlrpc.client


# Conexi√≥n con Odoo (manteniendo tus credenciales)
username = "juan.cano@donsson.com"  # tu usuario
password = "1000285668"         # tu contrase√±a
url = "https://donsson.com"     # URL del servidor
db = "Donsson_produccion" # nombre de la base de datos


# --- Autenticaci√≥n ---
common = xmlrpc.client.ServerProxy(f"{url}/xmlrpc/2/common")
uid = common.authenticate(db, username, password, {})
models = xmlrpc.client.ServerProxy(f"{url}/xmlrpc/2/object")


# --- Fechas autom√°ticas ---
hoy = date.today()
fecha_fin = hoy.strftime("%Y-%m-%d")
fecha_inicio = (hoy - timedelta(weeks=weeks)).strftime("%Y-%m-%d")

# --- 1) Buscar facturas v√°lidas (account.invoice) ---

invoice_domain = [
    ("date_invoice", ">=", fecha_inicio),
    ("date_invoice", "<=", fecha_fin),
    ("type", "=", "out_invoice"),    # solo ventas
    ("state", "in", ["open", "paid"])
]

invoice_ids = models.execute_kw(
    db, uid, password,
    "account.invoice", "search",
    [invoice_domain]
)
print(f"Facturas encontradas: {len(invoice_ids)}")

# --- 2) Descargar las l√≠neas de esas facturas (account.invoice.line) ---

# Campos de la L√çNEA de factura. Eliminamos 'number', 'user_id', 'section_id', 'partner_id' porque ir√°n en la factura.
line_fields = ["product_id", "quantity", "price_subtotal", "invoice_id","create_date","origin"] 

records = []
limit = 20000
offset = 0

while True:
    result = models.execute_kw(
        db, uid, password,
        "account.invoice.line", "search_read",
        [[("invoice_id", "in", invoice_ids)]],
        {"fields": line_fields, "limit": limit, "offset": offset}
    )
    if not result:
        break
    records.extend(result)
    offset += limit
    print(f"Descargados {len(records)} registros de l√≠neas...")

# --- 3) Pasar a DataFrame de l√≠neas ---
line_df = pd.DataFrame(records).fillna(0)


# Separar product_id
line_df["product_id_num"] = line_df["product_id"].apply(
    lambda x: x[0] if isinstance(x, (list, tuple)) else None
)
line_df["product_name"] = line_df["product_id"].apply(
    lambda x: x[1] if isinstance(x, (list, tuple)) else str(x)
)

# Separar invoice_id
line_df["invoice_id_num"] = line_df["invoice_id"].apply(
    lambda x: x[0] if isinstance(x, (list, tuple)) else None
)
line_df["invoice_name"] = line_df["invoice_id"].apply(
    lambda x: x[1] if isinstance(x, (list, tuple)) else str(x)
)

# Convertir fecha a datetime
line_df["date_invoice"] = pd.to_datetime(line_df["create_date"], errors="coerce")

# Eliminar las columnas originales problem√°ticas
line_df = line_df.drop(columns=["invoice_id","create_date"])

print(f"Total de l√≠neas descargadas: {len(line_df)}")

# ----------------------------------------------------
# --- 4) Descargar los campos adicionales de Factura (account.invoice) ---
# ----------------------------------------------------
# A√±adimos los campos que quieres: number, user_id, section_id, y tambi√©n partner_id y store_id
invoice_fields = ["id", "store_id", "number", "user_id", "section_id", "partner_id"]
invoices = models.execute_kw(
    db, uid, password,
    "account.invoice", "read",
    [invoice_ids], # Solo las facturas que encontramos
    {"fields": invoice_fields}
)
invoice_df = pd.DataFrame(invoices)

# --- 5) Procesar campos de la factura ---

# Separar store_id
invoice_df["store_name"] = invoice_df["store_id"].apply(
    lambda x: x[1] if isinstance(x, (list, tuple)) else str(x)
)

# Separar user_id (Vendedor)
invoice_df["salesperson_name"] = invoice_df["user_id"].apply(
    lambda x: x[1] if isinstance(x, (list, tuple)) else None
)

# Separar section_id (Equipo de Ventas)
invoice_df["sales_team_name"] = invoice_df["section_id"].apply(
    lambda x: x[1] if isinstance(x, (list, tuple)) else None
)

# Separar partner_id (Cliente/Partner)
invoice_df["partner_id_num"] = invoice_df["partner_id"].apply(
    lambda x: x[0] if isinstance(x, (list, tuple)) else None
)
# El nombre del partner es el segundo elemento de la tupla (si existe)
invoice_df["client_name_inv"] = invoice_df["partner_id"].apply(
    lambda x: x[1] if isinstance(x, (list, tuple)) else None
)


# Eliminar columnas originales no deseadas o ya procesadas
invoice_df = invoice_df.drop(columns=["store_id", "user_id", "section_id", "partner_id"])


# ----------------------------------------------------
# --- 6) Fusionar DataFrames ---
# ----------------------------------------------------

# Fusionamos las l√≠neas de factura (line_df) con los datos de las facturas (invoice_df)
df_merged = line_df.merge(
    invoice_df, 
    left_on="invoice_id_num", 
    right_on="id", 
    how="left"
)

# Limpieza final de columnas de IDs de factura
df_merged = df_merged.drop(columns=["invoice_id_num", "product_id_num"])


df_merged['origin'] = df_merged['origin'].astype('string')
df_merged["product_id"] = df_merged["product_id"].astype(str)

# Guardar
df_merged.to_parquet(f"ventashistoricas{weeks}semanas.parquet", index=False)

print(f"Total de l√≠neas descargadas con informaci√≥n de factura: {len(df_merged)}")

#para 52 semanas se demora aproximadamente 6.5 minutos
#para 56 semanas se demora aproximadamente 7 minutos
#para 105 semanas se demora aproximadamente 14 minutos

Facturas encontradas: 95112
Descargados 20000 registros de l√≠neas...
Descargados 40000 registros de l√≠neas...
Descargados 60000 registros de l√≠neas...
Descargados 80000 registros de l√≠neas...
Descargados 100000 registros de l√≠neas...
Descargados 120000 registros de l√≠neas...
Descargados 140000 registros de l√≠neas...
Descargados 160000 registros de l√≠neas...
Descargados 180000 registros de l√≠neas...
Descargados 200000 registros de l√≠neas...
Descargados 220000 registros de l√≠neas...
Descargados 240000 registros de l√≠neas...
Descargados 260000 registros de l√≠neas...
Descargados 280000 registros de l√≠neas...
Descargados 300000 registros de l√≠neas...
Descargados 320000 registros de l√≠neas...
Descargados 340000 registros de l√≠neas...
Descargados 360000 registros de l√≠neas...
Descargados 363781 registros de l√≠neas...
Total de l√≠neas descargadas: 363781
Total de l√≠neas descargadas con informaci√≥n de factura: 363781


In [3]:
df = df_merged.copy()

In [4]:
import re
import unicodedata



mapa_sucursales = {
    'BD1': 'PRINCIPAL COTA',
    'BD2': 'SUCURSAL CALLE 6',
    'BD3': 'SUCURSAL VALLADOLID',
    'BD4': 'SUCURSAL NORTE',
    'BD5': 'SUCURSAL MEDELLIN',
    'BD6': 'SUCURSAL BARRANQUILLA',
    'BD7':' SUCURSAL BUCARAGAMNGA ',
    'BD8':'MOSTRADOR COTA',
    'BD9':'SUCURSAL CALI',
    'BD11': 'CUMMINS DE LOS ANDES',
    'BD12': 'CUMMINS DE LOS ANDES MEDELLIN',
    'BD13': 'CSS CONSTRUCTORES',
    'BD14': 'ANTIOQUE√ëA DE LUBRICANTES SGP SAS',
    'BD15': 'ASEO CAPITAL',
    'BD16': 'COVIANDES',
    'BD18': 'CEMEX BOSA',
    'BD19': 'Cemex ibague (eliminar)',
    'BD21': 'CEMEX CENTENARIO',
    'BD22': 'PENDIENTE POR FACTURAR CIERRE CONT.',
    'BD24': 'FILTRO EN REPROCESO',
    'BD26': 'PRESTAMOS INTERNOS',
    'BD31': 'EXP.CTP',
    'BD32': 'EXP. ECUADOR',
    'BD34':'EXP.DONSSON.USA',
    'BD40': 'DESCUADRE B1',
    'BD MP':'MATERIA PRIMA',
    'BD41':'BODEGA VENDEDOR WILMER GIL',
    'BD33':'EXP.REP.DOMINICANA',
    'BD42':'STOCK SIGMA ENERGY'
    # Agrega m√°s c√≥digos si los encuentras en tus datos, siguiendo este formato.
    }




def clasificar_sucursal(invoice_name):
    if pd.isna(invoice_name):
        return "VENDEDOR EXTERNO"
    if "Mostrador" in invoice_name:
        return "MOSTRADOR"
    return "VENDEDOR EXTERNO"
    
df["Sucursal_tipo"] = df["invoice_name"].apply(clasificar_sucursal)


df["client_name"] = df["client_name_inv"].str.split("] ", expand=True)[1].str.strip()



#Quitar las facturas que salen como SO son no vendibles
df = df[~(df["origin"].str.contains("SO"))] 


# Normalizar los separadores para que todos sean iguales
df["origin_norm"] = df["origin"].str.replace(r"[\\/]", "/", regex=True)

# Extraer solo el BD y el n√∫mero (ejemplo: BD11, BD9, etc.)
df["origen"] = df["origin_norm"].str.extract(r"^(BD\d+)")

df["Bodega"] = df["origen"].map(mapa_sucursales)
df["Bodega"] = df["Bodega"].fillna(df["store_name"])

df = df.drop(columns=["origin_norm"])

df = df.drop(columns=["origin"])

df["product_ref"] = df["product_name"].str.extract(r"\[([A-Z0-9]+)\]")

df["product_nom"] = df["product_name"].str.extract(r"\]\s*([A-Z]\w+)")


df["date_invoice"] = pd.to_datetime(df["date_invoice"])
df["mes"] = df["date_invoice"].dt.month
df["a√±o"] = df["date_invoice"].dt.year
df["dia"] = df["date_invoice"].dt.day

df = df[~(df["product_ref"].isna())]

pd.set_option('display.max_columns', None)

df['marca'] = df['product_ref'].apply(
    lambda x: 'BALDWIN' if str(x).endswith('125') else
              'DONSSON' if str(x).endswith('025') else
              'AUT*PARTS' if str(x).endswith('189') else
              'RACOR BRASIL' if str(x).endswith('137') else
              'RACOR USA' if str(x).endswith('138') else
              'OTRA'
)

In [26]:
df["tipo_venta"] = (
    df["sales_team_name"]
    .str.upper()
    .apply(lambda x: 
        "MOSTRADOR" if "MOSTRADOR" in x 
        else "EXTERNO" if "EXTERNO" in x 
        else "OTRO"
    )
)


df.head()

Unnamed: 0,product_id,price_subtotal,id_x,quantity,product_name,invoice_name,date_invoice,number,id_y,store_name,salesperson_name,sales_team_name,partner_id_num,client_name_inv,Sucursal_tipo,client_name,origen,Bodega,product_ref,product_nom,mes,a√±o,dia,marca,amount_total,tipo_venta
0,"[25693, '[BCS00705125] GS705 FILTRO COMBUSTIBL...",162400,1659785,1,[BCS00705125] GS705 FILTRO COMBUSTIBLE CAMIONE...,FCAL6255,2025-11-19 20:40:31,FCAL6255,449451,SUCURSAL CALI,WILMER GIL,SUCURSALES / CALI / EXTERNOS CALI,14473,[CO191461130] MARIO ALBERTO HUERTAS COTES,VENDEDOR EXTERNO,MARIO ALBERTO HUERTAS COTES,BD41,BODEGA VENDEDOR WILMER GIL,BCS00705125,GS705,11,2025,19,BALDWIN,162400,EXTERNO
1,"[17972, '[DAE09022025] DA9022 FILTRO AIRE DONS...",115000,1659784,2,[DAE09022025] DA9022 FILTRO AIRE DONSSON - LOV...,PV2E45178 Mostrador Calle 6 T2/21946,2025-11-19 20:39:49,PV2E45178,449450,SUCURSAL CALLE 6,JAIME ANDRES CABALLERO CABALLERO,SUCURSALES / Ventas Mostrador Cll6,3218,[CO8301342461] IMPORTADORA COLOMBIANA DE AUTOP...,MOSTRADOR,IMPORTADORA COLOMBIANA DE AUTOPARTES S.A.S.,,SUCURSAL CALLE 6,DAE09022025,DA9022,11,2025,19,DONSSON,115000,MOSTRADOR
2,"[19157, '[BCS00208125] GS208 FILTRO COMBUSTIBL...",40400,1659783,1,[BCS00208125] GS208 FILTRO COMBUSTIBLE CATERPI...,FCAL6254,2025-11-19 20:37:52,FCAL6254,449449,SUCURSAL CALI,WILMER GIL,SUCURSALES / CALI / EXTERNOS CALI,14473,[CO191461130] MARIO ALBERTO HUERTAS COTES,VENDEDOR EXTERNO,MARIO ALBERTO HUERTAS COTES,BD41,BODEGA VENDEDOR WILMER GIL,BCS00208125,GS208,11,2025,19,BALDWIN,40400,EXTERNO
3,"[47435, '[DCE00764189] G764 FILTRO SEPARDOR CO...",27000,1659782,1,[DCE00764189] G764 FILTRO SEPARDOR COMBUSTIBLE...,FCAL6254,2025-11-19 20:37:52,FCAL6254,449449,SUCURSAL CALI,WILMER GIL,SUCURSALES / CALI / EXTERNOS CALI,14473,[CO191461130] MARIO ALBERTO HUERTAS COTES,VENDEDOR EXTERNO,MARIO ALBERTO HUERTAS COTES,BD41,BODEGA VENDEDOR WILMER GIL,DCE00764189,G764,11,2025,19,AUT*PARTS,27000,EXTERNO
4,"[17740, '[DAB04982025] DA4982 FILTRO AIRE INT....",70700,1659781,1,[DAB04982025] DA4982 FILTRO AIRE INT. CAMION I...,FCAL6254,2025-11-19 20:37:52,FCAL6254,449449,SUCURSAL CALI,WILMER GIL,SUCURSALES / CALI / EXTERNOS CALI,14473,[CO191461130] MARIO ALBERTO HUERTAS COTES,VENDEDOR EXTERNO,MARIO ALBERTO HUERTAS COTES,BD41,BODEGA VENDEDOR WILMER GIL,DAB04982025,DA4982,11,2025,19,DONSSON,70700,EXTERNO


In [27]:
df_marketing = df[df["date_invoice"]>="2025-1-1"]

df_marketing = df_marketing[["salesperson_name","client_name","price_subtotal","quantity","mes","a√±o","dia","marca","date_invoice","tipo_venta","store_name","invoice_name","sales_team_name"]]
df_marketing.head()

df_marketing.to_excel("/home/donsson/proyectos/VENTAS/datasets_salida/ventasxmesxvendedor.xlsx")

## VENTAS PERDIDAS

In [7]:
import xmlrpc.client
from datetime import date, timedelta
import pandas as pd

# ===============================
# 1. Conexi√≥n con Odoo
# ===============================

ODOO_URL = "https://donsson.com"
ODOO_DB = "Donsson_produccion"
ODOO_USERNAME = "juan.cano@donsson.com"
ODOO_PASSWORD = "1000285668"

# Autenticaci√≥n
common = xmlrpc.client.ServerProxy(f"{ODOO_URL}/xmlrpc/2/common")
uid = common.authenticate(ODOO_DB, ODOO_USERNAME, ODOO_PASSWORD, {})
if not uid:
    print("Error de autenticaci√≥n. Verifica tus credenciales.")
    exit()
models = xmlrpc.client.ServerProxy(f"{ODOO_URL}/xmlrpc/2/object")

# ===============================
# 2. Definir rango de semanas
# ===============================

# N√∫mero de semanas que quieres descargar (puedes cambiarlo)
NUM_SEMANAS = weeks

# Fecha de hoy
hoy = date.today()
# Fecha de inicio seg√∫n n√∫mero de semanas atr√°s
fecha_inicio = hoy - timedelta(weeks=NUM_SEMANAS)

FECHA_INICIO = fecha_inicio.strftime("%Y-%m-%d")
FECHA_FIN = hoy.strftime("%Y-%m-%d")

print(f"üìÖ Descargando registros desde {FECHA_INICIO} hasta {FECHA_FIN}")

# ===============================
# 3. Leer ventas perdidas
# ===============================

lost_sales_ids = models.execute_kw(
    ODOO_DB, uid, ODOO_PASSWORD,
    "ventas.perdidas", "search",
    [[["fecha", ">=", FECHA_INICIO], ["fecha", "<=", FECHA_FIN], ["almacenamiento_tipo", "=", "agotado"]]]
)

lost_sales_data = models.execute_kw(
    ODOO_DB, uid, ODOO_PASSWORD,
    "ventas.perdidas", "read",
    [lost_sales_ids],
    {"fields": ["origen", "store_id", "cliente_id", "fecha", "product_ref",
                "cantidad", "cantidad_existencia", "cantidad_reservada",
                "almacenamiento_tipo"]}
)

df_vp = pd.DataFrame(lost_sales_data)

# ===============================
# 4. Normalizar columnas
# ===============================

for col in ["store_id", "cliente_id"]:
    df_vp[col.replace('_id', '_name')] = df_vp[col].apply(
        lambda x: x[1] if isinstance(x, (list, tuple)) and len(x) > 1 else str(x) if x else None
    )
    df_vp[col + "_num"] = df_vp[col].apply(
        lambda x: x[0] if isinstance(x, (list, tuple)) and len(x) > 0 else None
    )

# Eliminar columnas originales
df_vp = df_vp.drop(columns=["id", "store_id", "cliente_id"], errors='ignore')

# ===============================
# 4.1. Forzar tipos de columnas antes de exportar
# ===============================
for col in df_vp.columns:
    if col.endswith("_num"):
        df_vp[col] = pd.to_numeric(df_vp[col], errors="coerce").astype("Int64")
    else:
        df_vp[col] = df_vp[col].astype("string")

df_vp = df_vp.copy()



üìÖ Descargando registros desde 2023-12-20 hasta 2025-11-19


In [8]:
df_vp.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 126270 entries, 0 to 126269
Data columns (total 11 columns):
 #   Column               Non-Null Count   Dtype 
---  ------               --------------   ----- 
 0   cantidad_reservada   126270 non-null  string
 1   product_ref          126270 non-null  string
 2   cantidad             126270 non-null  string
 3   almacenamiento_tipo  126270 non-null  string
 4   fecha                126270 non-null  string
 5   cantidad_existencia  126270 non-null  string
 6   origen               126270 non-null  string
 7   store_name           126270 non-null  string
 8   store_id_num         126270 non-null  Int64 
 9   cliente_name         126270 non-null  string
 10  cliente_id_num       126270 non-null  Int64 
dtypes: Int64(2), string(9)
memory usage: 10.8 MB


In [9]:
# ===============================
# Filtrar almacenamiento agotado
# ===============================
df_vp = df_vp[df_vp["almacenamiento_tipo"].str.lower() == "agotado"]

# ===============================
# Asegurar tipos correctos
# ===============================
df_vp = df_vp.copy()
df_vp["fecha"] = pd.to_datetime(df_vp["fecha"], errors="coerce")

# Num√©ricos
for col in ["cantidad", "cantidad_existencia", "cantidad_reservada"]:
    df_vp[col] = pd.to_numeric(df_vp[col], errors="coerce").fillna(0).clip(lower=0)

# ===============================
# Reglas Odoo vectorizadas
# ===============================
is_cot = df_vp["origen"].fillna("").str.lower() == "cotizacion"
ignore_mask = df_vp["cantidad"] >= 100

ajuste = np.where(
    is_cot,
    df_vp["cantidad"] - df_vp["cantidad_existencia"] - df_vp["cantidad_reservada"],
    df_vp["cantidad"] - df_vp["cantidad_reservada"]
)

# Aplicar reglas de descarte y piso en cero
ajuste = np.where(ignore_mask, 0, ajuste)
ajuste = np.where(ajuste > 0, ajuste, 0)

df_vp["ventas_perdidas"] = ajuste.astype(float)

# ===============================
# Columnas temporales
# ===============================
df_vp["Semana"] = df_vp["fecha"].dt.to_period("M").dt.start_time
df_vp["ano"]   = df_vp["Semana"].dt.year
df_vp["mes"]   = df_vp["Semana"].dt.month
df_vp["dia"]   = df_vp["Semana"].dt.day

# ===============================
# Filtro adicional: excluir SERV y CARCASA
# ===============================
mask_excluir = ~df_vp["product_ref"].str.contains("SERV|CARCASA", case=False, na=False)
df_vp = df_vp[mask_excluir]

# ===============================
# Agrupaci√≥n por tienda + producto + semana
# ===============================
lost_by_week = (
    df_vp.groupby(["store_name", "product_ref", "mes", "ano", "Semana", "dia"])
    .agg(
        lost_sales=("ventas_perdidas", "sum"),   # suma total de ventas perdidas
        veces_vp=("ventas_perdidas", "count")    # n√∫mero de veces que hubo p√©rdida
    )
    .reset_index()
)

# Mostrar resultado agrupado
vp_month = lost_by_week


In [10]:
vp_month[vp_month["product_ref"]=="DAB08177025"]

Unnamed: 0,store_name,product_ref,mes,ano,Semana,dia,lost_sales,veces_vp
7064,PRINCIPAL COTA,DAB08177025,5,2024,2024-05-01,1,1.0,1
7065,PRINCIPAL COTA,DAB08177025,6,2025,2025-06-01,1,1.0,1
7066,PRINCIPAL COTA,DAB08177025,7,2025,2025-07-01,1,6.0,5
7067,PRINCIPAL COTA,DAB08177025,8,2025,2025-08-01,1,7.0,3
7068,PRINCIPAL COTA,DAB08177025,9,2025,2025-09-01,1,4.0,4
7069,PRINCIPAL COTA,DAB08177025,10,2025,2025-10-01,1,4.0,3
7070,PRINCIPAL COTA,DAB08177025,11,2025,2025-11-01,1,1.0,1
21101,SUCURSAL BARRANQUILLA,DAB08177025,9,2025,2025-09-01,1,6.0,1
21102,SUCURSAL BARRANQUILLA,DAB08177025,10,2024,2024-10-01,1,0.0,1
21103,SUCURSAL BARRANQUILLA,DAB08177025,10,2025,2025-10-01,1,1.0,1


In [11]:
from datetime import datetime

# Fecha y hora actual en formato YYYYMMDD_HHMMSS
timestamp = datetime.now().strftime("%Y%m%d")

# Nombre din√°mico
filename = f"/home/donsson/proyectos/VENTAS/prom_ventas/promedio_ventas_{timestamp}.xlsx"

# Guardar el Excel
df.to_excel(filename, index=False)

print(f"Archivo guardado: {filename}")


df_vp.to_excel("/home/donsson/proyectos/VENTAS/prom_ventas/vp_mes.xlsx")

#Tiempo promedio 3 minutos

Archivo guardado: /home/donsson/proyectos/VENTAS/prom_ventas/promedio_ventas_20251119.xlsx


## VISUM

In [12]:
df.head()

Unnamed: 0,product_id,price_subtotal,id_x,quantity,product_name,invoice_name,date_invoice,number,id_y,store_name,salesperson_name,sales_team_name,partner_id_num,client_name_inv,Sucursal_tipo,client_name,origen,Bodega,product_ref,product_nom,mes,a√±o,dia,marca
0,"[25693, '[BCS00705125] GS705 FILTRO COMBUSTIBL...",162400.0,1659785,1.0,[BCS00705125] GS705 FILTRO COMBUSTIBLE CAMIONE...,FCAL6255,2025-11-19 20:40:31,FCAL6255,449451,SUCURSAL CALI,WILMER GIL,SUCURSALES / CALI / EXTERNOS CALI,14473,[CO191461130] MARIO ALBERTO HUERTAS COTES,VENDEDOR EXTERNO,MARIO ALBERTO HUERTAS COTES,BD41,BODEGA VENDEDOR WILMER GIL,BCS00705125,GS705,11,2025,19,BALDWIN
1,"[17972, '[DAE09022025] DA9022 FILTRO AIRE DONS...",115000.0,1659784,2.0,[DAE09022025] DA9022 FILTRO AIRE DONSSON - LOV...,PV2E45178 Mostrador Calle 6 T2/21946,2025-11-19 20:39:49,PV2E45178,449450,SUCURSAL CALLE 6,JAIME ANDRES CABALLERO CABALLERO,SUCURSALES / Ventas Mostrador Cll6,3218,[CO8301342461] IMPORTADORA COLOMBIANA DE AUTOP...,MOSTRADOR,IMPORTADORA COLOMBIANA DE AUTOPARTES S.A.S.,,SUCURSAL CALLE 6,DAE09022025,DA9022,11,2025,19,DONSSON
2,"[19157, '[BCS00208125] GS208 FILTRO COMBUSTIBL...",40400.0,1659783,1.0,[BCS00208125] GS208 FILTRO COMBUSTIBLE CATERPI...,FCAL6254,2025-11-19 20:37:52,FCAL6254,449449,SUCURSAL CALI,WILMER GIL,SUCURSALES / CALI / EXTERNOS CALI,14473,[CO191461130] MARIO ALBERTO HUERTAS COTES,VENDEDOR EXTERNO,MARIO ALBERTO HUERTAS COTES,BD41,BODEGA VENDEDOR WILMER GIL,BCS00208125,GS208,11,2025,19,BALDWIN
3,"[47435, '[DCE00764189] G764 FILTRO SEPARDOR CO...",27000.0,1659782,1.0,[DCE00764189] G764 FILTRO SEPARDOR COMBUSTIBLE...,FCAL6254,2025-11-19 20:37:52,FCAL6254,449449,SUCURSAL CALI,WILMER GIL,SUCURSALES / CALI / EXTERNOS CALI,14473,[CO191461130] MARIO ALBERTO HUERTAS COTES,VENDEDOR EXTERNO,MARIO ALBERTO HUERTAS COTES,BD41,BODEGA VENDEDOR WILMER GIL,DCE00764189,G764,11,2025,19,AUT*PARTS
4,"[17740, '[DAB04982025] DA4982 FILTRO AIRE INT....",70700.0,1659781,1.0,[DAB04982025] DA4982 FILTRO AIRE INT. CAMION I...,FCAL6254,2025-11-19 20:37:52,FCAL6254,449449,SUCURSAL CALI,WILMER GIL,SUCURSALES / CALI / EXTERNOS CALI,14473,[CO191461130] MARIO ALBERTO HUERTAS COTES,VENDEDOR EXTERNO,MARIO ALBERTO HUERTAS COTES,BD41,BODEGA VENDEDOR WILMER GIL,DAB04982025,DA4982,11,2025,19,DONSSON


In [13]:
import pandas as pd
from datetime import datetime
from dateutil.relativedelta import relativedelta

# -------- CONFIGURACI√ìN --------
clientes = {
    "VISUM LTDA",
    "VILMAR LUBRICANTES S.A.S.",
    "ESTACION Y LUBRICANTES SAN ANTONIO GNV S.A.S.",
    "SODATRANS LTDA",
    "ESTACION Y LUBRICANTES CASABLANCA S.A.S"
}

# Asegurar que date_invoice es datetime
df["date_invoice"] = pd.to_datetime(df["date_invoice"])

# ‚úÖ Usar price_subtotal como valor sin impuestos (Odoo ya es qty * price_unit)
df["amount_total"] = df["price_subtotal"]

# -------- DETECTAR √öLTIMO MES CERRADO --------
hoy = datetime.today()

# Ej: si hoy es noviembre 2025, cerr√≥ octubre 2025
ultimo_mes_cerrado = pd.Period((hoy.replace(day=1) - relativedelta(days=1)), freq="M")
print("√öltimo mes cerrado:", ultimo_mes_cerrado.strftime("%B %Y"))

# √öltimos 6 meses previos al cerrado
meses_previos = pd.period_range(
    ultimo_mes_cerrado - 12,   # inicio (mes 7 hacia atr√°s)
    ultimo_mes_cerrado - 1,   # fin (6 meses antes del cerrado)
    freq="M"
)

# -------- FILTRAR DATOS --------
df_h = df[
    (df["client_name"].isin(clientes))
].copy()

# Crear columna a√±o-mes
df_h["periodo"] = df_h["date_invoice"].dt.to_period("M")

# -------- AGRUPACI√ìN MENSUAL --------
ventas_mensuales = (
    df_h.groupby(["client_name", "marca", "periodo"])["amount_total"]
    .sum()
    .reset_index()
)

# -------- CREAR BASE COMPLETA DE MESES PARA CADA CLIENTE + MARCA --------
base_completa = (
    pd.MultiIndex.from_product(
        [df_h["client_name"].unique(), df_h["marca"].unique(), meses_previos],
        names=["client_name", "marca", "periodo"]
    ).to_frame(index=False)
)

# Unimos: meses sin ventas quedan en 0
ventas_previos_6m = base_completa.merge(
    ventas_mensuales,
    on=["client_name", "marca", "periodo"],
    how="left"
).fillna({"amount_total": 0})

# -------- PROMEDIO 6 MESES --------
prom_6m = (
    ventas_previos_6m.groupby(["client_name", "marca"])["amount_total"]
    .mean()
    .reset_index()
    .rename(columns={"amount_total": "promedio_12_meses"})
)

# -------- VENTAS √öLTIMO MES CERRADO --------
ventas_ultimo_mes = (
    ventas_mensuales[ventas_mensuales["periodo"] == ultimo_mes_cerrado]
    [["client_name", "marca", "amount_total"]]
    .rename(columns={"amount_total": "ventas_mes_cerrado"})
)

# -------- UNIR RESULTADOS --------
resultado = prom_6m.merge(
    ventas_ultimo_mes,
    on=["client_name", "marca"],
    how="left"
)

# -------- FORMATO FINAL --------
pd.set_option("display.float_format", "{:,.0f}".format)

resultado["promedio_12_meses"] = resultado["promedio_12_meses"].fillna(0).astype(int)
resultado["ventas_mes_cerrado"] = resultado["ventas_mes_cerrado"].fillna(0).astype(int)



print("√öltimo mes cerrado detectado:", ultimo_mes_cerrado)


√öltimo mes cerrado: October 2025
√öltimo mes cerrado detectado: 2025-10


In [14]:
ventas_previos_6m.head(17)

Unnamed: 0,client_name,marca,periodo,amount_total
0,VISUM LTDA,BALDWIN,2024-10,3307300
1,VISUM LTDA,BALDWIN,2024-11,21010900
2,VISUM LTDA,BALDWIN,2024-12,28816600
3,VISUM LTDA,BALDWIN,2025-01,20549200
4,VISUM LTDA,BALDWIN,2025-02,0
5,VISUM LTDA,BALDWIN,2025-03,30025300
6,VISUM LTDA,BALDWIN,2025-04,878900
7,VISUM LTDA,BALDWIN,2025-05,22803600
8,VISUM LTDA,BALDWIN,2025-06,12988300
9,VISUM LTDA,BALDWIN,2025-07,235800


In [15]:
resultado.head(40)

Unnamed: 0,client_name,marca,promedio_12_meses,ventas_mes_cerrado
0,ESTACION Y LUBRICANTES CASABLANCA S.A.S,AUT*PARTS,0,0
1,ESTACION Y LUBRICANTES CASABLANCA S.A.S,BALDWIN,612033,2292500
2,ESTACION Y LUBRICANTES CASABLANCA S.A.S,DONSSON,116366,206800
3,ESTACION Y LUBRICANTES CASABLANCA S.A.S,OTRA,0,0
4,ESTACION Y LUBRICANTES CASABLANCA S.A.S,RACOR BRASIL,0,0
5,ESTACION Y LUBRICANTES CASABLANCA S.A.S,RACOR USA,0,0
6,ESTACION Y LUBRICANTES SAN ANTONIO GNV S.A.S.,AUT*PARTS,837483,0
7,ESTACION Y LUBRICANTES SAN ANTONIO GNV S.A.S.,BALDWIN,2794800,1658300
8,ESTACION Y LUBRICANTES SAN ANTONIO GNV S.A.S.,DONSSON,1182925,906700
9,ESTACION Y LUBRICANTES SAN ANTONIO GNV S.A.S.,OTRA,6133,0


In [16]:
resultado.to_excel("/home/donsson/proyectos/VENTAS/datasets_salida/prom_rutachiquinquira.xlsx")