In [None]:
import os

from_drive = True  # same flag you use everywhere

if os.environ.get("ATLAS_BOOTSTRAPPED") != "1":
    # ---------- GIT ON COLAB ONLY ----------
    try:
        from google.colab import userdata

        git_token = userdata.get('gitToken')
        git_user = userdata.get('gitUser')
        git_url = f'https://{git_token}@github.com/rene-aum/Atlas.git'
        branch_to_pull = 'dev'

        os.chdir('/content')

        if not os.path.isdir('Atlas'):
            !git clone {git_url}

        %cd Atlas
        !git fetch origin {branch_to_pull}
        !git checkout {branch_to_pull}
        !git pull origin {branch_to_pull}

        !pip install -r PipelinesConsumo/src/requirements.txt
        %cd PipelinesConsumo

    except Exception as e:
        print(e)
        print('Running in other environment not colab probably!')

    # ---------- DRIVE + SHEETS ----------
    if from_drive:
        from pydrive2.auth import GoogleAuth
        from pydrive2.drive import GoogleDrive
        from google.colab import auth
        from oauth2client.client import GoogleCredentials
        import gspread
        from google.auth import default
        from gspread_dataframe import set_with_dataframe
        import gdown

        auth.authenticate_user()
        gauth = GoogleAuth()
        gauth.credentials = GoogleCredentials.get_application_default()
        drive = GoogleDrive(gauth)

        creds, _ = default()
        gc = gspread.authorize(creds)

    os.environ["ATLAS_BOOTSTRAPPED"] = "1"
else:
    print("Bootstrap already done, assuming orchestrator ran it.")

import sys
import glob
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
import warnings
import sys
sys.path.append('..')
sys.path.append('../..')
from utils.utils import (get_dates_dataframe,
                       add_year_week,
                       custom_read,
                       process_columns,
                       remove_accents)
from PipelinesConsumo.src.rawAtlas import RawAtlas
from PipelinesConsumo.src.processedAtlas import ProcessedAtlas
from src.transformed import Transformed
from utils.drive_toolbox import(from_drive_to_local,
                             get_last_modification_date_drive,
                             create_sheets_in_drive_folder,
                             update_sheets_in_drive_folder,
                             read_from_google_sheets,
                             list_file_ids_for_drive_folder,
                             create_csv_file_in_drive_folder,
                             write_csv_to_drive,
                             read_csv_from_drive)
from src.constants import (atlas_raw_output_folder_id,
                           atlas_consumo_output_folder_id,
                           consumo_sheets_ids_dict,
                           data_source_folder_id,
                           raw_output_ids,
                           folder_id_bauto_gabo,
                           id_reporte_ventas,
                           id_edas_referenciados,
                           id_torre_de_control
                           )


warnings.filterwarnings('ignore')

from google.colab import auth
auth.authenticate_user()


In [None]:

import io
import pandas as pd
from googleapiclient.discovery import build
from googleapiclient.http import MediaIoBaseDownload
from google.auth import default

# 1. Configurar credenciales
creds, _ = default()
drive_service = build('drive', 'v3', credentials=creds)

# 2. Definir el ID del nuevo archivo
file_id = '1raTDAr2fRnP-B9VJi58gNgD6KQVkBMvH'

# 3. Descargar el flujo de datos
request = drive_service.files().get_media(fileId=file_id)
downloaded = io.BytesIO()
downloader = MediaIoBaseDownload(downloaded, request)

done = False
while done is False:
    status, done = downloader.next_chunk()
    if status:
        print(f"Descarga: {int(status.progress() * 100)}%")

# 4. Cargar en DataFrame
downloaded.seek(0)
df = pd.read_csv(downloaded, low_memory=False)

print("\n--- Carga Exitosa ---")
print(f"Filas: {df.shape[0]} | Columnas: {df.shape[1]}")


In [None]:
import os

def read_csv_final(drive_instance, file_id):
    # 1. Descarga el archivo
    file_drive = drive_instance.CreateFile({'id': file_id})
    temp_filename = 'data_reporte.csv'
    file_drive.GetContentFile(temp_filename)

    # 2. Leemos saltando las 8 filas y con el encoding correcto
    # No usamos usecols aqu√≠ para evitar el error de "out of bounds"
    df = pd.read_csv(temp_filename, encoding='latin-1', skiprows=8, low_memory=False)

    # 3. Eliminamos la primera columna (Columna A)
    # iloc[:, 1:] significa: "todas las filas, desde la columna 1 hasta el final"
    df = df.iloc[:, 1:]

    # Limpieza extra: eliminar columnas que est√©n completamente vac√≠as (opcional)
    df = df.dropna(axis=1, how='all')

    return df

# Ejecuci√≥n
id_csv = '1gkgwmIJ4uctdxu_pdUU9LCyj4NHhRR_7'
df_1 = read_csv_final(drive, id_csv)

print(f"Columnas actuales: {len(df_1.columns)}")
df_1.head(2)


#print(df_1.columns.tolist())

parent_folder_pedidos = list(list_file_ids_for_drive_folder(drive,'1yVMEVT9zooZXOsiYHnZ1FZVGDZJQQ-sv').items())[0]
print(parent_folder_pedidos)
file_pedidos_reciente = list(list_file_ids_for_drive_folder(drive,parent_folder_pedidos[1]).items())[0]
print(file_pedidos_reciente)
id_pedidos_reciente = file_pedidos_reciente[1]
print(id_pedidos_reciente)

from_drive_to_local(drive,id_pedidos_reciente,'pedidos_latest.csv')
pedidos = pd.read_csv('pedidos_latest.csv',encoding='latin-1',skiprows=8)
unamed_cols = [col for col in pedidos.columns if 'Unnamed' in col]
pedidos = pedidos.drop(columns=unamed_cols)
df_1=pedidos.copy()

fecha_max = pd.to_datetime(df_1['Fecha de creaci√≥n'], format='%d/%m/%Y').max()
fecha_max


In [None]:

# 1. Asegurar que la fecha sea v√°lida y calcular los d√≠as
df_1['Fecha de creaci√≥n'] = pd.to_datetime(df_1['Fecha de creaci√≥n'],format='%d/%m/%Y', errors='coerce')
hoy = datetime.now()
df_1['dias_abiertos'] = (hoy - df_1['Fecha de creaci√≥n']).dt.days

# 2. Definir los cortes de 30 en 30 d√≠as y sus etiquetas
# Creamos rangos hasta 360 d√≠as y un grupo final para m√°s de un a√±o
bins = [0, 30, 60, 90, 120, 150, 180, 360, 10000]
labels = [
    '0-30 d√≠as',
    '31-60 d√≠as',
    '61-90 d√≠as',
    '91-120 d√≠as',
    '121-150 d√≠as',
    '151-180 d√≠as',
    '181-360 d√≠as',
    'M√°s de 360 d√≠as'
]

# Creamos la columna de rangos
df_1['Rango_Aging'] = pd.cut(df_1['dias_abiertos'], bins=bins, labels=labels, include_lowest=True)

# 3. Etapas a validar
etapas_interes = [
    'Revisi√≥n de auto',
    'Acuerdo de compraventa',
    'Negociaci√≥n de precio',
    'Cita para Entrega',
    'Auto en cita'
]


In [None]:

# ***Generaci√≥n del reporte***

import pandas as pd
import numpy as np
from datetime import datetime
from IPython.display import display


In [None]:

# --- CONFIGURACI√ìN DE B√öSQUEDA ---
dias_minimo = 0
dias_maximo = 1500
estado_buscado = ['Revisi√≥n de auto', 'Acuerdo de compraventa', 'Negociaci√≥n de precio', 'Cita para Entrega', 'Auto en cita']
id_sheets_1 = '1qitnBwGCg7n-IFPaOBZfdBK2vCplNTqPOjpiJcoZX7k' # Torre Vieja
id_sheets_2 = '1k8rguLeF1O33XCaVDxPiQ1C4SbxLDSIeqNcriYtsF-k' # Torre Nueva
# ---------------------------------

def get_df_from_ws(ws):
    data = ws.get_all_values()
    if not data: return pd.DataFrame()
    headers = data[0]
    return pd.DataFrame(data[1:], columns=headers)

# 1. CARGA DE DATOS CRM
sh1 = gc.open_by_key(id_sheets_1)
df_cc1 = get_df_from_ws(sh1.worksheet('Contact Center'))
df_asig1 = get_df_from_ws(sh1.worksheet('Asignaci√≥n compradores'))

sh2 = gc.open_by_key(id_sheets_2)
df_cc2 = get_df_from_ws(sh2.worksheet('contact center'))
df_asig2 = get_df_from_ws(sh2.worksheet('asignacion'))

# 2. PROCESAMIENTO BASE PRINCIPAL (df_1)
df_1['Fecha de creaci√≥n'] = pd.to_datetime(df_1['Fecha de creaci√≥n'], errors='coerce')
hoy = datetime.now()
df_1['dias_abiertos'] = (hoy - df_1['Fecha de creaci√≥n']).dt.days.fillna(0).astype(int)
df_1['N√∫mero de pedido_num'] = pd.to_numeric(df_1['N√∫mero de pedido'], errors='coerce').fillna(0).astype(int)
df_1['Comprador: Id Comercio Externo'] = pd.to_numeric(df_1['Comprador: Id Comercio Externo'], errors='coerce').astype('Int64')

filtro = (
    (df_1['Estado'].isin(estado_buscado)) &
    (df_1['dias_abiertos'] > dias_minimo) &
    (df_1['dias_abiertos'] <= dias_maximo)
)
df_resultados = df_1[filtro].copy()

# 3. L√ìGICA DE B√öSQUEDA DE LEADS
def obtener_lista_leads(row):
    num_pedido = row['N√∫mero de pedido_num']
    id_comercio = str(row['Comprador: Id Comercio Externo']).strip().split('.')[0]
    leads_encontrados = []

    m1_ped = df_cc1[pd.to_numeric(df_cc1['ID de pedido'], errors='coerce') == num_pedido]
    if not m1_ped.empty: leads_encontrados.extend(m1_ped['ID Lead'].unique().tolist())

    if not leads_encontrados and id_comercio not in ['<NA>', 'nan', 'N/A']:
        m1_com = df_asig1[df_asig1['ID comprador'].astype(str) == id_comercio]
        if not m1_com.empty: leads_encontrados.extend(m1_com['ID Lead'].unique().tolist())

    m2_ped = df_cc2[pd.to_numeric(df_cc2['ID de pedido'], errors='coerce') == num_pedido]
    if not m2_ped.empty:
        for l in m2_ped['ID Lead'].unique():
            if l not in leads_encontrados: leads_encontrados.append(l)

    if not leads_encontrados and id_comercio not in ['<NA>', 'nan', 'N/A']:
        m2_com = df_asig2[df_asig2['id comprador'].astype(str) == id_comercio]
        if not m2_com.empty:
            col_lead = 'id lead' if 'id lead' in df_asig2.columns else 'ID Lead'
            for l in m2_com[col_lead].unique():
                if l not in leads_encontrados: leads_encontrados.append(l)

    return leads_encontrados if leads_encontrados else ["N/A"]

df_resultados['ID Lead'] = df_resultados.apply(obtener_lista_leads, axis=1)
df_expandido = df_resultados.explode('ID Lead').reset_index(drop=True)

# 4. FUNCI√ìN PARA BUSCAR INFO EXTRA (CONSERVANDO SKU)
def buscar_info_extra(row):
    lead = str(row['ID Lead']).strip().split('.')[0]
    info = {
        'Estatus de Lead': 'N/A', 'Origen': 'N/A', 'Asesor Ventas': 'N/A',
        'Asesor CC': 'N/A', 'ID Comprador': 'N/A', 'Fecha Asignaci√≥n': 'N/A',
        'Torre de Control': 'N/A', 'SKU PROD': 'N/A', 'asesor credito': 'N/A'
    }

    if lead == "N/A": return pd.Series(info)

    # B√∫squeda Torre 1
    m1 = df_asig1[df_asig1['ID Lead'].astype(str).str.contains(lead, na=False)]
    if not m1.empty:
        res = m1.iloc[0]
        info.update({
            'Estatus de Lead': res.get('Estatus de Lead', 'N/A'),
            'SKU PROD': res.get('SKU de Producto', 'N/A'),
            'Origen': res.get('Origen AutoMarket', 'N/A'),
            'Asesor Ventas': res.get('Asesor de Ventas', 'N/A'),
            'Asesor CC': res.get('Asesor CC front', 'N/A'),
            'ID Comprador': res.get('ID comprador', 'N/A'),
            'Fecha Asignaci√≥n': res.get('Fecha de asignaci√≥n', 'N/A'),
            'Torre de Control': 'TC V1'
        })
        return pd.Series(info)

    # B√∫squeda Torre 2
    m2 = df_asig2[df_asig2['id lead'].astype(str).str.contains(lead, na=False)] if 'id lead' in df_asig2.columns else pd.DataFrame()
    if not m2.empty:
        res = m2.iloc[0]
        info.update({
            'Estatus de Lead': res.get('estatus de lead', 'N/A'),
            'SKU PROD': res.get('sku de producto', 'N/A'),
            'asesor credito': res.get('asesor credito', 'N/A'),
            'Origen': res.get('origen automarket', 'N/A'),
            'Asesor Ventas': res.get('asesor espacio', 'N/A'),
            'Asesor CC': res.get('asesor cc', 'N/A'),
            'ID Comprador': res.get('id comprador', 'N/A'),
            'Fecha Asignaci√≥n': res.get('fecha de asignacion', 'N/A'),
            'Torre de Control': 'TC V2'
        })
        return pd.Series(info)

    return pd.Series(info)

df_info = df_expandido.apply(buscar_info_extra, axis=1)
df_final = pd.concat([df_expandido, df_info], axis=1)

# 5. C√ÅLCULO DE D√çAS
df_final['d√≠as creaci√≥n-asignaci√≥n'] = df_final.apply(
    lambda r: int(abs((pd.to_datetime(r['Fecha Asignaci√≥n'], errors='coerce') - r['Fecha de creaci√≥n']).days))
    if pd.notna(r['Fecha de creaci√≥n']) and pd.notna(pd.to_datetime(r['Fecha Asignaci√≥n'], errors='coerce')) else "N/A", axis=1
)

# 6. TABLA FINAL: AQU√ç CONSERVAMOS TODO
# En lugar de filtrar columnas, usamos todas las existentes en df_final
df_tabla = df_final.copy()

# Renombrar solo si la columna existe para evitar KeyErrors
if 'Activo: Producto: Nombre del producto' in df_tabla.columns:
    df_tabla = df_tabla.rename(columns={'Activo: Producto: Nombre del producto': 'Descripci√≥n Auto'})

# Formateo de fechas
df_tabla['Fecha de creaci√≥n'] = df_tabla['Fecha de creaci√≥n'].dt.strftime('%Y-%m-%d')
df_tabla = df_tabla.sort_values(by='dias_abiertos', ascending=False)

print(f"üìä REPORTE COMPLETO (TODAS LAS COLUMNAS)")
display(df_tabla.reset_index(drop=True))

df_tabla = df_tabla.sort_values(by=['N√∫mero de pedido','d√≠as creaci√≥n-asignaci√≥n'],ascending=[True,True])

# Desduplicar por n√∫mero de pedido
# el df ya est√° ordenado
df_tabla = df_tabla.groupby('N√∫mero de pedido').head(1)

df_tabla['N√∫mero de pedido'].nunique(),df_tabla.shape[0]


In [None]:

# --- CONFIGURACI√ìN DE EXPORTACI√ìN ---
# Nueva carpeta de destino proporcionada
id_carpeta_destino = '1q3OtSK_RrZKLYb0YXtIMlDxmbRJPt-YY'
id_latest = '1Shb0TjoBLN4iDJBp9--BFs4V1s6MxaRO0sdmoRl0Z2I'

# Generamos el nombre con el formato exacto: Estatus Salesforce ddmmaaaa-hh:mm:ss
nombre_archivo = datetime.now().strftime('Estatus Salesforce %d%m%Y-%H:%M:%S')
# ------------------------------------

try:
    # 1. Crear el nuevo archivo de Google Sheets directamente en la carpeta de destino
    nuevo_sh = gc.create(nombre_archivo, id_carpeta_destino)

    # 2. Renombrar la primera hoja a 'Pedidos'
    hoja_pedidos = nuevo_sh.get_worksheet(0)
    hoja_pedidos.update_title('Pedidos')

    # 3. Preparar los datos para la exportaci√≥n (Mantenimiento de UTF-8)
    df_export = df_tabla.copy()

    # Convertimos el DataFrame a una lista de listas
    datos_a_enviar = [df_export.columns.values.tolist()] + df_export.values.tolist()

    # 4. Volcar la informaci√≥n en la hoja
    hoja_pedidos.update('A1', datos_a_enviar)

    # 5. Confirmaci√≥n y enlace
    print(f"‚úÖ Reporte exportado con √©xito (UTF-8 preservado).")
    print(f"üìÑ Archivo: {nombre_archivo}")
    print(f"üîó Enlace: {nuevo_sh.url}")

except Exception as e:
    print(f"Error durante la exportaci√≥n a Google Sheets: {e}")



In [None]:


# Cargar el dataframe (asumiendo que la funci√≥n ya est√° definida)
vsraw = read_csv_from_drive(drive, '1LnxD5KjR3iEbN2nmomUZwMp3kLYzES06')

# Cambiar nombres de columnas
nuevos_nombres_raw = {
    'order_id':                  'ID Commerce',
    'sku':                       'SKU',
    'status_product':            'Estatus de Publicaci√≥n'
}


In [None]:

vsraw = vsraw.rename(columns=nuevos_nombres_raw)

# Definimos el mapeo: 'Nombre Actual': 'Nombre Nuevo'
nombres_nuevos_DF = {
    'N√∫mero de pedido':           'N√∫mero de Pedido',
    'Pedido: Id comercio externo':'ID Commerce',
    'Estado':                     'Estado en TC',
    'dias_abiertos':              'Cantidad de d√≠as abierto',
    'Fecha de creaci√≥n':          'Fecha de creaci√≥n de pedido',
    'ID Lead':                    'ID Lead',
    'Estatus de Lead':            'Estatus de Lead en TC',
    'Origen':                     'Origen de Lead',
    'Asesor Ventas':              'Asesor de Venta (EAM)',
    'asesor credito':             'Asesor de Cr√©dito (C√©lula de Cr√©dito)',
    'Asesor CC':                  'Asesor CC (Contact Center)',
    'ID Comprador':               'ID Comprador',
    'Fecha Asignaci√≥n':           'Fecha de Asignaci√≥n',
    'd√≠as creaci√≥n-asignaci√≥n':   'D√≠as de diferencia entre Creaci√≥n y Asignaci√≥n',
    'Torre de Control':           'TC donde est√° el Leal',
    'Descripci√≥n Auto':           'Auto'
}

# Aplicamos el cambio en una sola l√≠nea
df_export = df_export.rename(columns=nombres_nuevos_DF)
# Merge (Left Join)
# Tomamos como principal df_export (left) y lo unimos con vsraw por 'ID Commerce'
df_final = df_export.merge(
    vsraw[['ID Commerce', 'SKU', 'Estatus de Publicaci√≥n']],
    on='ID Commerce',
    how='left'
)

df_final = df_final[df_final['Estatus de Publicaci√≥n'] == 'reserved']

col_finales = [
    'N√∫mero de Pedido', 
    'ID Commerce', 
    'Estado en TC', 
    'Cantidad de d√≠as abierto', 
    'Fecha de creaci√≥n de pedido', 
    'ID Lead', 
    'Estatus de Lead en TC', 
    'Origen de Lead', 
    'Asesor de Venta (EAM)', 
    'Asesor de Cr√©dito (C√©lula de Cr√©dito)', 
    'Asesor CC (Contact Center)', 
    'ID Comprador', 
    'Fecha de Asignaci√≥n', 
    'D√≠as de diferencia entre Creaci√≥n y Asignaci√≥n', 
    'TC donde est√° el Leal', 
    'Auto', 
    'SKU', 
    'Estatus de Publicaci√≥n'
]

# Creamos la tabla solo con lo que pediste
df_final = df_final[col_finales].copy()


In [None]:

df_final.columns

update_sheets_in_drive_folder(gc, '1Shb0TjoBLN4iDJBp9--BFs4V1s6MxaRO0sdmoRl0Z2I', 'Pedidos', df_final)


In [None]:

import requests
import json

def enviar_aviso_finalizado():
    # Tu URL del Webhook
    webhook_url = "https://chat.googleapis.com/v1/spaces/AAQAcQfW5IA/messages?key=AIzaSyDdI0hCZtE6vySjMm-WEfRq3CPzqKqqsHI&token=6bcIc7ptX82oYSxRpchIt7AJjrAKCnxcwrmynJ_eQyU"
    #webhook_url = "https://chat.googleapis.com/v1/spaces/AAQAcQfW5IA/messages?key=AIzaSyDdI0hCZtE6vySjMm-WEfRq3CPzqKqqsHI&token=MyN5aj4JOhcNyV7wqLF_OmVvpgXUzKJemQcZefenrCg"

    try:
        # El mensaje simple que solicitaste
        payload = {
            "text": f"*Reporte de Estatus de Pedidos ejecutado correctamente*, la fecha m√°s reciente es: {fecha_max}"
        }

        # Realizar el env√≠o
        response = requests.post(
            webhook_url,
            data=json.dumps(payload),
            headers={'Content-Type': 'application/json; charset=UTF-8'}
        )

        if response.status_code == 200:
            print("Notificaci√≥n enviada a Google Chat.")
        else:
            print(f"Error al enviar: {response.status_code}")

    except Exception as e:
        print(f"Error en la funci√≥n: {e}")

# --- EJECUCI√ìN ---
enviar_aviso_finalizado()