In [None]:
# Instalar el paquete thefuzz e importar librerias
!pip install thefuzz

import pandas as pd
from thefuzz import fuzz, process
import numpy as np




In [None]:
# Cargar archivo Excel
file_path = 'dataset.xlsx'

In [None]:

# 1. CARGA DE DATOS
beauty = pd.read_excel(file_path, sheet_name='BEAUTY')
fashion = pd.read_excel(file_path, sheet_name='FASHION')
mlm = pd.read_excel(file_path, sheet_name='MLM')
wellness = pd.read_excel(file_path, sheet_name='WELLNESS')

nl_feb = pd.read_excel(file_path, sheet_name='NL FEBRUARY 2025 - loxo')
nc_fashion = pd.read_excel(file_path, sheet_name='NC FASHION JANUARY 2025 - loxo')
nc_beauty = pd.read_excel(file_path, sheet_name='NC BEAUTY MARCH 2025 srcwhale')
nc_wellness = pd.read_excel(file_path, sheet_name='NC WELLNESS APRIL 2025 srcwhale')
ip_beauty = pd.read_excel(file_path, sheet_name='IP BEAUTY JUNE 2025')

# 2. DICCIONARIO DE NORMALIZACI√ìN A MAY√öSCULAS CONSISTENTES
mapeo_normalizacion = {
    # Informaci√≥n personal - todas a MAY√öSCULAS consistentes
    'NAME': 'NAME',
    'LAST NAME': 'LAST_NAME',
    'First Name': 'NAME',
    'Full Name': 'FULL_NAME',
    'EMAIL': 'EMAIL',
    'Email': 'EMAIL',
    'Emails': 'EMAIL',
    'PHONE': 'PHONE',
    'Phone': 'PHONE',
    'Phone Number': 'PHONE',
    'LINKEDIN': 'LINKEDIN',
    'Linkedin': 'LINKEDIN',

    # Informaci√≥n profesional
    'TITLE': 'TITLE',
    'Title': 'TITLE',
    'Job Title': 'TITLE',
    'COMPANY': 'COMPANY',
    'Company': 'COMPANY',

    # Informaci√≥n empresarial
    'REVENUE': 'REVENUE',
    'EMPLOYEES': 'EMPLOYEES',
    'INDUSTRY': 'INDUSTRY',
    'LOCATION': 'LOCATION',
    'ADDRESS': 'ADDRESS',
    'CITY': 'CITY',
    'STATE': 'STATE',
    'ZIP': 'ZIP',
    'COUNTRY': 'COUNTRY',

    # Campa√±as y m√©tricas
    'CAMPAIGN': 'CAMPAIGN',
    'Campaign': 'CAMPAIGN',
    'NC Campaign': 'CAMPAIGN',
    'EMAIL OPEN': 'EMAIL_OPEN',
    'Email Open': 'EMAIL_OPEN',
    'OPENS': 'OPENS',
    'Opens': 'OPENS',
    'CLICK': 'CLICK',
    'Click': 'CLICK',
    'CLICKS': 'CLICKS',
    'Clicks': 'CLICKS',
    'EMAIL REPLIED': 'EMAIL_REPLIED',
    'Email Replied': 'EMAIL_REPLIED',
    'LAST STAGE': 'LAST_STAGE',
    'Last Stage': 'LAST_STAGE',
    'STAGE': 'STAGE',
    'Stage': 'STAGE',
    'GLOBAL STAGE': 'GLOBAL_STAGE',
    'FAILED': 'FAILED',
    'Failed': 'FAILED',
    'SOURCE': 'SOURCE',
    'SOURCED': 'SOURCED',
    'SOURCED BY': 'SOURCED_BY',
    'JOB SKILLS': 'JOB_SKILLS',
    'TAGS': 'TAGS'
}

def normalizar_columnas(df, nombre_tabla):
    print(f"üîÑ Normalizando: {nombre_tabla}")
    print(f"   Antes: {list(df.columns)}")

    # Crear mapeo espec√≠fico para las columnas que existen en este DataFrame
    mapeo_aplicar = {}
    for col_original in df.columns:
        if col_original in mapeo_normalizacion:
            mapeo_aplicar[col_original] = mapeo_normalizacion[col_original]
        else:
            # Si no est√° en el mapeo, mantenerla pero en MAY√öSCULAS
            mapeo_aplicar[col_original] = col_original.upper().replace(' ', '_')

    df_normalizado = df.rename(columns=mapeo_aplicar)
    print(f"   Despu√©s: {list(df_normalizado.columns)}")
    return df_normalizado

# 3. APLICAR NORMALIZACI√ìN
print("=== NORMALIZANDO COLUMNAS A MAY√öSCULAS CONSISTENTES ===\n")

# Tablas maestras
beauty_norm = normalizar_columnas(beauty, "BEAUTY")
fashion_norm = normalizar_columnas(fashion, "FASHION")
mlm_norm = normalizar_columnas(mlm, "MLM")
wellness_norm = normalizar_columnas(wellness, "WELLNESS")

# Tablas campa√±as
nl_feb_norm = normalizar_columnas(nl_feb, "NL FEBRUARY 2025 - loxo")
nc_fashion_norm = normalizar_columnas(nc_fashion, "NC FASHION JANUARY 2025 - loxo")
nc_beauty_norm = normalizar_columnas(nc_beauty, "NC BEAUTY MARCH 2025 srcwhale")
nc_wellness_norm = normalizar_columnas(nc_wellness, "NC WELLNESS APRIL 2025 srcwhale")
ip_beauty_norm = normalizar_columnas(ip_beauty, "IP BEAUTY JUNE 2025")


# 4. VERIFICAR COLUMNAS COMUNES
def analizar_columnas_comunes(tablas, nombre_grupo):
    print(f"\n=== COLUMNAS COMUNES EN {nombre_grupo} ===")

    todas_columnas = set()
    for i, df in enumerate(tablas):
        todas_columnas.update(df.columns)
        print(f"Tabla {i+1}: {len(df.columns)} columnas")

    columnas_comunes = set(tablas[0].columns)
    for df in tablas[1:]:
        columnas_comunes = columnas_comunes.intersection(df.columns)

    print(f"Columnas comunes: {sorted(columnas_comunes)}")
    print(f"Total columnas √∫nicas en el grupo: {len(todas_columnas)}")
    return columnas_comunes

# Analizar grupos
tablas_maestras = [beauty_norm, fashion_norm, mlm_norm, wellness_norm]
tablas_campanas = [nl_feb_norm, nc_fashion_norm, nc_beauty_norm, nc_wellness_norm, ip_beauty_norm]

comunes_maestras = analizar_columnas_comunes(tablas_maestras, "TABLAS MAESTRAS")
comunes_campanas = analizar_columnas_comunes(tablas_campanas, "TABLAS CAMPA√ëAS")

# 5. COLUMNAS CLAVE PARA RELACIONAR
print(f" COLUMNAS CLAVE PARA RELACIONAR:")
print(f"EMAIL est√° en maestras: {'EMAIL' in comunes_maestras}")
print(f"EMAIL est√° en campa√±as: {'EMAIL' in comunes_campanas}")
print(f"COMPANY est√° en maestras: {'COMPANY' in comunes_maestras}")
print(f"COMPANY est√° en campa√±as: {'COMPANY' in comunes_campanas}")

=== NORMALIZANDO COLUMNAS A MAY√öSCULAS CONSISTENTES ===

üîÑ Normalizando: BEAUTY
   Antes: ['NAME', 'LAST NAME', 'EMAIL', 'PHONE', 'LINKEDIN', 'TITLE', 'COMPANY', 'REVENUE', 'EMPLOYEES', 'INDUSTRY', 'GLOBAL STAGE']
   Despu√©s: ['NAME', 'LAST_NAME', 'EMAIL', 'PHONE', 'LINKEDIN', 'TITLE', 'COMPANY', 'REVENUE', 'EMPLOYEES', 'INDUSTRY', 'GLOBAL_STAGE']
üîÑ Normalizando: FASHION
   Antes: ['NAME', 'LAST NAME', 'EMAIL', 'PHONE', 'LINKEDIN', 'TITLE', 'COMPANY', 'REVENUE', 'EMPLOYEES', 'INDUSTRY', 'GLOBAL STAGE']
   Despu√©s: ['NAME', 'LAST_NAME', 'EMAIL', 'PHONE', 'LINKEDIN', 'TITLE', 'COMPANY', 'REVENUE', 'EMPLOYEES', 'INDUSTRY', 'GLOBAL_STAGE']
üîÑ Normalizando: MLM
   Antes: ['NAME', 'LAST NAME', 'EMAIL', 'PHONE', 'LINKEDIN', 'TITLE', 'COMPANY', 'REVENUE', 'EMPLOYEES', 'INDUSTRY', 'GLOBAL STAGE']
   Despu√©s: ['NAME', 'LAST_NAME', 'EMAIL', 'PHONE', 'LINKEDIN', 'TITLE', 'COMPANY', 'REVENUE', 'EMPLOYEES', 'INDUSTRY', 'GLOBAL_STAGE']
üîÑ Normalizando: WELLNESS
   Antes: ['NAME', 'LAST 

In [None]:
# 6. AN√ÅLISIS DE NULOS Y DUPLICADOS POR TABLA
print("=== AN√ÅLISIS DE CALIDAD DE DATOS ===\n")

def analizar_calidad_datos(df, nombre_tabla):
    print(f" {nombre_tabla}")
    print(f"   Filas: {len(df)}")
    print(f"   Columnas: {len(df.columns)}")

    # An√°lisis de nulos
    nulos_totales = df.isnull().sum().sum()
    nulos_por_columna = df.isnull().sum()

    print(f"   Nulos totales: {nulos_totales} ({nulos_totales/(len(df)*len(df.columns))*100:.1f}%)")

    # Mostrar columnas con m√°s nulos
    columnas_con_nulos = nulos_por_columna[nulos_por_columna > 0]
    if len(columnas_con_nulos) > 0:
        print("   Columnas con nulos:")
        for col, nulos in columnas_con_nulos.items():
            porcentaje = (nulos/len(df))*100
            print(f"     {col}: {nulos} nulos ({porcentaje:.1f}%)")

    # An√°lisis de duplicados
    duplicados_totales = df.duplicated().sum()
    duplicados_email = df['EMAIL'].duplicated().sum() if 'EMAIL' in df.columns else 'N/A'
    duplicados_email_notnull = df[df['EMAIL'].notnull()]['EMAIL'].duplicated().sum() if 'EMAIL' in df.columns else 'N/A'

    print(f"   Duplicados totales: {duplicados_totales} ({duplicados_totales/len(df)*100:.1f}%)")
    if 'EMAIL' in df.columns:
        print(f"   Emails duplicados: {duplicados_email}")
        print(f"   Emails duplicados (no nulos): {duplicados_email_notnull}")

    # Verificar emails √∫nicos y v√°lidos
    if 'EMAIL' in df.columns:
        emails_unicos = df['EMAIL'].nunique()
        emails_validos = df['EMAIL'].str.contains('@', na=False).sum()
        print(f"   Emails √∫nicos: {emails_unicos}")
        print(f"   Emails v√°lidos (con @): {emails_validos}")

    print("-" * 60)

# Analizar calidad de tablas maestras
print(" TABLAS MAESTRAS:")
analizar_calidad_datos(beauty_norm, "BEAUTY")
analizar_calidad_datos(fashion_norm, "FASHION")
analizar_calidad_datos(mlm_norm, "MLM")
analizar_calidad_datos(wellness_norm, "WELLNESS")

# Analizar calidad de tablas campa√±as
print("\n TABLAS CAMPA√ëAS:")
analizar_calidad_datos(nl_feb_norm, "NL FEBRUARY 2025 - loxo")
analizar_calidad_datos(nc_fashion_norm, "NC FASHION JANUARY 2025 - loxo")
analizar_calidad_datos(nc_beauty_norm, "NC BEAUTY MARCH 2025 srcwhale")
analizar_calidad_datos(nc_wellness_norm, "NC WELLNESS APRIL 2025 srcwhale")
analizar_calidad_datos(ip_beauty_norm, "IP BEAUTY JUNE 2025")

# 7. RESUMEN GENERAL
print("\n=== RESUMEN GENERAL DE CALIDAD ===")

def resumen_general(tablas, nombres, tipo):
    total_filas = sum(len(df) for df in tablas)
    total_nulos = sum(df.isnull().sum().sum() for df in tablas)
    total_duplicados = sum(df.duplicated().sum() for df in tablas)

    # Emails √∫nicos y v√°lidos
    todos_emails = []
    for df in tablas:
        if 'EMAIL' in df.columns:
            emails_validos = df[df['EMAIL'].str.contains('@', na=False)]['EMAIL'].dropna()
            todos_emails.extend(emails_validos.tolist())

    emails_unicos_totales = len(set(todos_emails)) if todos_emails else 0

    print(f"{tipo}:")
    print(f"  Total tablas: {len(tablas)}")
    print(f"  Total filas: {total_filas}")
    print(f"  Total nulos: {total_nulos} ({total_nulos/(total_filas*len(tablas[0].columns))*100:.1f}%)")
    print(f"  Total duplicados: {total_duplicados} ({total_duplicados/total_filas*100:.1f}%)")
    print(f"  Emails √∫nicos v√°lidos: {emails_unicos_totales}")

resumen_general(tablas_maestras, ["BEAUTY", "FASHION", "MLM", "WELLNESS"], "TABLAS MAESTRAS")
resumen_general(tablas_campanas, ["NL FEB", "NC FASHION", "NC BEAUTY", "NC WELLNESS", "IP BEAUTY"], "TABLAS CAMPA√ëAS")

# 8. IDENTIFICAR PROBLEMAS CR√çTICOS
print("\  PROBLEMAS CR√çTICOS IDENTIFICADOS:")

def identificar_problemas_criticos(df, nombre):
    problemas = []

    if 'EMAIL' in df.columns:
        # Emails nulos
        emails_nulos = df['EMAIL'].isnull().sum()
        if emails_nulos > 0:
            problemas.append(f"{emails_nulos} emails nulos")

        # Emails inv√°lidos
        emails_invalidos = df[df['EMAIL'].notnull() & ~df['EMAIL'].str.contains('@', na=False)].shape[0]
        if emails_invalidos > 0:
            problemas.append(f"{emails_invalidos} emails inv√°lidos")

    # Duplicados cr√≠ticos
    duplicados = df.duplicated().sum()
    if duplicados > 0:
        problemas.append(f"{duplicados} registros duplicados")

    if problemas:
        print(f"  {nombre}: {', '.join(problemas)}")

print("Tablas Maestras:")
for df, nombre in zip(tablas_maestras, ["BEAUTY", "FASHION", "MLM", "WELLNESS"]):
    identificar_problemas_criticos(df, nombre)

print("Tablas Campa√±as:")
for df, nombre in zip(tablas_campanas, ["NL FEB", "NC FASHION", "NC BEAUTY", "NC WELLNESS", "IP BEAUTY"]):
    identificar_problemas_criticos(df, nombre)

=== AN√ÅLISIS DE CALIDAD DE DATOS ===

 TABLAS MAESTRAS:
 BEAUTY
   Filas: 50
   Columnas: 11
   Nulos totales: 23 (4.2%)
   Columnas con nulos:
     PHONE: 6 nulos (12.0%)
     LINKEDIN: 17 nulos (34.0%)
   Duplicados totales: 0 (0.0%)
   Emails duplicados: 1
   Emails duplicados (no nulos): 1
   Emails √∫nicos: 49
   Emails v√°lidos (con @): 50
------------------------------------------------------------
 FASHION
   Filas: 50
   Columnas: 11
   Nulos totales: 29 (5.3%)
   Columnas con nulos:
     PHONE: 3 nulos (6.0%)
     LINKEDIN: 26 nulos (52.0%)
   Duplicados totales: 1 (2.0%)
   Emails duplicados: 2
   Emails duplicados (no nulos): 2
   Emails √∫nicos: 48
   Emails v√°lidos (con @): 50
------------------------------------------------------------
 MLM
   Filas: 50
   Columnas: 11
   Nulos totales: 27 (4.9%)
   Columnas con nulos:
     PHONE: 4 nulos (8.0%)
     LINKEDIN: 23 nulos (46.0%)
   Duplicados totales: 1 (2.0%)
   Emails duplicados: 2
   Emails duplicados (no nulos): 2
  

  print("\  PROBLEMAS CR√çTICOS IDENTIFICADOS:")


In [None]:
# 9 Eliminar duplicados exactos
maestras_clean = [df.drop_duplicates() for df in tablas_maestras]

# 9.1 Quedarse con primer registro de emails duplicados
maestras_clean = [df.drop_duplicates(subset=['EMAIL'], keep='first') for df in maestras_clean]

# 9.2 Limpiar duplicados en campa√±as
nl_feb_clean = nl_feb_norm.drop_duplicates().drop_duplicates(subset=['EMAIL'], keep='first')
nc_fashion_clean = nc_fashion_norm.drop_duplicates().drop_duplicates(subset=['EMAIL'], keep='first')
nc_beauty_clean = nc_beauty_norm.drop_duplicates().drop_duplicates(subset=['EMAIL'], keep='first')
nc_wellness_clean = nc_wellness_norm.drop_duplicates().drop_duplicates(subset=['EMAIL'], keep='first')
ip_beauty_clean = ip_beauty_norm.drop_duplicates().drop_duplicates(subset=['EMAIL'], keep='first')

# 9.3 CORRECCI√ìN: Verificar las tablas YA LIMPIAS
print("‚úÖ VERIFICACI√ìN CORREGIDA - TABLAS LIMPIAS:")

# Verificar maestras limpias
for df, nombre in zip(maestras_clean, ["BEAUTY", "FASHION", "MLM", "WELLNESS"]):
    print(f"{nombre}: {df.duplicated().sum()} dup, {df.duplicated(subset=['EMAIL']).sum()} dup email")

# Verificar campa√±as limpias
campanas_clean = [nl_feb_clean, nc_fashion_clean, nc_beauty_clean, nc_wellness_clean, ip_beauty_clean]
for df, nombre in zip(campanas_clean, ["NL FEB", "NC FASHION", "NC BEAUTY", "NC WELLNESS", "IP BEAUTY"]):
    print(f"{nombre}: {df.duplicated().sum()} dup, {df.duplicated(subset=['EMAIL']).sum()} dup email")

‚úÖ VERIFICACI√ìN CORREGIDA - TABLAS LIMPIAS:
BEAUTY: 0 dup, 0 dup email
FASHION: 0 dup, 0 dup email
MLM: 0 dup, 0 dup email
WELLNESS: 0 dup, 0 dup email
NL FEB: 0 dup, 0 dup email
NC FASHION: 0 dup, 0 dup email
NC BEAUTY: 0 dup, 0 dup email
NC WELLNESS: 0 dup, 0 dup email
IP BEAUTY: 0 dup, 0 dup email


In [None]:
# PROSPECTOS FALTANTES CON DETALLE BREVE
print("PROSPECTOS FALTANTES:\n")

for campana_df, campana_nombre in zip(tablas_campanas, ["NL FEB", "NC FASHION", "NC BEAUTY", "NC WELLNESS", "IP BEAUTY"]):
    if 'EMAIL' in campana_df.columns:
        for idx, row in campana_df.iterrows():
            email = str(row['EMAIL']).lower() if pd.notna(row['EMAIL']) else None
            if email and email not in emails_maestras:
                print(f"üìß {email}")
                print(f"   üë§ {row.get('NAME', 'N/A')} | üè¢ {row.get('COMPANY', 'N/A')}")
                print(f"   üéØ {campana_nombre} | {row.get('CAMPAIGN', 'N/A')}")

                # Sugerencia autom√°tica
                if 'FASHION' in campana_nombre: dest = 'FASHION'
                elif 'BEAUTY' in campana_nombre: dest = 'BEAUTY'
                elif 'WELLNESS' in campana_nombre: dest = 'WELLNESS'
                else: dest = 'WELLNESS'
                print(f"   üí° Sugerido: {dest}")
                print()

PROSPECTOS FALTANTES:

üìß new.contact@mindfulpath.com
   üë§ Sophia | üè¢ Mindful Path
   üéØ NC WELLNESS | NC WELLNESS APRIL 2025
   üí° Sugerido: WELLNESS



In [None]:
##Asignaci√≥n tabla maestra a los faltantes

# 1. Michael Chen a FASHION
nuevo_fashion = pd.DataFrame([{
    'EMAIL': 'm.chen@outlook.com',
    'NAME': 'Michael',
    'LAST_NAME': 'Chen',
    'COMPANY': 'Urban Threads Co',
    'INDUSTRY': 'FASHION',
    'GLOBAL_STAGE': 'NEW_LEAD'
}])
fashion_norm = pd.concat([fashion_norm, nuevo_fashion], ignore_index=True)

# 2. Samantha Jones a FASHION
nuevo_fashion2 = pd.DataFrame([{
    'EMAIL': 's.jones@gmail.com',
    'NAME': 'Samantha',
    'LAST_NAME': 'Jones',
    'COMPANY': 'Style Dynamics',
    'INDUSTRY': 'FASHION',
    'GLOBAL_STAGE': 'NEW_LEAD'
}])
fashion_norm = pd.concat([fashion_norm, nuevo_fashion2], ignore_index=True)
# 3. Sophia a WELLNESS (CORREGIDO)
nuevo_wellness = pd.DataFrame([{
    'EMAIL': 'new.contact@mindfulpath.com',
    'NAME': 'Sophia',
    'LAST_NAME': '',
    'COMPANY': 'Mindful Path',
    'INDUSTRY': 'WELLNESS',
    'GLOBAL_STAGE': 'NEW_LEAD'
}])
wellness_norm = pd.concat([wellness_norm, nuevo_wellness], ignore_index=True)  # ‚Üê ESTA L√çNEA FALTABA

# Verificar
emails_maestras_actualizado = set()
for df in [beauty_norm, fashion_norm, mlm_norm, wellness_norm]:
    emails_maestras_actualizado.update(df['EMAIL'].str.lower().dropna())

prospectos_faltantes_final = emails_campanas - emails_maestras_actualizado
print(f"‚úÖ CORRELACI√ìN FINAL: {len(prospectos_faltantes_final)} prospectos faltantes")

‚úÖ CORRELACI√ìN FINAL: 0 prospectos faltantes


In [None]:
# 1. AGREGAR COLUMNA INDUSTRY A CADA TABLA MAESTRA
beauty_norm['INDUSTRY'] = 'BEAUTY'
fashion_norm['INDUSTRY'] = 'FASHION'
mlm_norm['INDUSTRY'] = 'MLM'
wellness_norm['INDUSTRY'] = 'WELLNESS'

# 2. CONCATENAR TODAS LAS MAESTRAS
maestra_unificada = pd.concat([beauty_norm, fashion_norm, mlm_norm, wellness_norm], ignore_index=True)

# 3. MOSTRAR LA TABLA UNIFICADA
print(" MAESTRA UNIFICADA - PRIMERAS 15 FILAS:")
print(maestra_unificada[['EMAIL', 'NAME', 'COMPANY', 'INDUSTRY', 'GLOBAL_STAGE']].head(15))

print(f"\nüìà ESTAD√çSTICAS:")
print(f"Total filas: {len(maestra_unificada)}")
print(f"Distribuci√≥n por industria:")
print(maestra_unificada['INDUSTRY'].value_counts())

 MAESTRA UNIFICADA - PRIMERAS 15 FILAS:
                           EMAIL       NAME             COMPANY INDUSTRY  \
0        alice.facey@outlook.com      Alice     The Skincare Co   BEAUTY   
1      vgoddevrind@yahoocorp.com    Vanessa   Goddevrind Beauty   BEAUTY   
2            michael.e@gmail.com    Michael  Edelmann Cosmetics   BEAUTY   
3             kdubin@hotmail.com       Kate          DUBIN & CO   BEAUTY   
4       eva.soohoo@111skin.co.uk        Eva        111 SKIN LTD   BEAUTY   
5            yannialex@gmail.com      Yanni            111 Skin   BEAUTY   
6   eva.alexandridis@outlook.com        Eva         Scent & Co.   BEAUTY   
7      milena.naydenov@yahoo.com     Milena     Naydenov Makeup   BEAUTY   
8                 kjoy@yahoo.com      Kevin       Joy Cosmetics   BEAUTY   
9           karima.mcd@gmail.com     Karima  McDaniel Fragrance   BEAUTY   
10           eshuman@hotmail.com  Elizabeth        Shuman & Co.   BEAUTY   
11          martin.eke@yahoo.com     Martin  Eke

In [None]:
# 1. IDENTIFICAR LAS TABLAS LIMPIAS
# Las tablas limpias tienen "_clean" al final
tablas_limpias = {
    'MAESTRA_UNIFICADA': maestra_unificada,
    'NL FEBRUARY 2025 - loxo': nl_feb_clean,
    'NC FASHION JANUARY 2025 - loxo': nc_fashion_clean,
    'NC BEAUTY MARCH 2025 srcwhale': nc_beauty_clean,
    'NC WELLNESS APRIL 2025 srcwhale': nc_wellness_clean,
    'IP BEAUTY JUNE 2025': ip_beauty_clean
}

# 2. CREAR EXCEL CON TODAS LAS HOJAS
print("üíæ CREANDO EXCEL CON TODAS LAS TABLAS...")

with pd.ExcelWriter('TABLAS_PROCESADAS_COMPLETAS.xlsx') as writer:
    for nombre_hoja, dataframe in tablas_limpias.items():
        dataframe.to_excel(writer, sheet_name=nombre_hoja, index=False)
        print(f"‚úÖ Hoja agregada: {nombre_hoja} ({len(dataframe)} filas)")

# 3. VERIFICACI√ìN FINAL
print(f"\nüìä RESUMEN DE EXPORTACI√ìN:")
print(f"Archivo creado: TABLAS_PROCESADAS_COMPLETAS.xlsx")
print(f"Total hojas: {len(tablas_limpias)}")

for nombre_hoja, dataframe in tablas_limpias.items():
    print(f"üìã {nombre_hoja}: {len(dataframe)} registros, {len(dataframe.columns)} columnas")

print("\nüéØ LISTO PARA DESCARGAR: TABLAS_PROCESADAS_COMPLETAS.xlsx")

üíæ CREANDO EXCEL CON TODAS LAS TABLAS...
‚úÖ Hoja agregada: MAESTRA_UNIFICADA (203 filas)
‚úÖ Hoja agregada: NL FEBRUARY 2025 - loxo (37 filas)
‚úÖ Hoja agregada: NC FASHION JANUARY 2025 - loxo (10 filas)
‚úÖ Hoja agregada: NC BEAUTY MARCH 2025 srcwhale (12 filas)
‚úÖ Hoja agregada: NC WELLNESS APRIL 2025 srcwhale (12 filas)
‚úÖ Hoja agregada: IP BEAUTY JUNE 2025 (10 filas)

üìä RESUMEN DE EXPORTACI√ìN:
Archivo creado: TABLAS_PROCESADAS_COMPLETAS.xlsx
Total hojas: 6
üìã MAESTRA_UNIFICADA: 203 registros, 11 columnas
üìã NL FEBRUARY 2025 - loxo: 37 registros, 17 columnas
üìã NC FASHION JANUARY 2025 - loxo: 10 registros, 17 columnas
üìã NC BEAUTY MARCH 2025 srcwhale: 12 registros, 17 columnas
üìã NC WELLNESS APRIL 2025 srcwhale: 12 registros, 17 columnas
üìã IP BEAUTY JUNE 2025: 10 registros, 17 columnas

üéØ LISTO PARA DESCARGAR: TABLAS_PROCESADAS_COMPLETAS.xlsx
