# CLTV VISUALIZACIÓN

In [None]:
import pyodbc
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import logging
from datetime import datetime

# Configuración básica de logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

# Configuración de conexión a SQL Server
LOCAL_SERVER = "localhost"
LOCAL_DATABASE = "master"  
LOCAL_DRIVER = "{ODBC Driver 17 for SQL Server}"
local_conn_str = f"DRIVER={LOCAL_DRIVER};SERVER={LOCAL_SERVER};DATABASE={LOCAL_DATABASE};Trusted_Connection=yes;TrustServerCertificate=yes"

# Ruta al archivo SQL con la consulta CLTV
SQL_FOLDER_PATH = "../sql/CLTV/"
SQL_FILE = "SQLQuery_CLTV.sql" 
def load_cltv_data():
    """Carga los datos de CLTV desde SQL Server"""
    try:
        # Leer la consulta SQL
        with open(f"{SQL_FOLDER_PATH}{SQL_FILE}", "r", encoding="utf-8") as file:
            query = file.read()
        
        # Conectar y ejecutar consulta
        conn = pyodbc.connect(local_conn_str)
        df = pd.read_sql(query, conn)
        conn.close()
        
        logging.info(f"Datos de CLTV cargados correctamente. Filas obtenidas: {len(df)}")
        return df
    
    except Exception as e:
        logging.error(f"Error al cargar datos CLTV: {str(e)}")
        return None

def analyze_cltv(df):
    """Realiza análisis estadísticos y gráficos del CLTV"""
    if df is None or df.empty:
        logging.error("No hay datos para analizar")
        return
    
    # Verificar si existe la columna CLTV
    if 'CLTV' not in df.columns:
        logging.error("No se encontró la columna 'CLTV' en los datos")
        return
    
    # Análisis estadístico básico
    stats = {
        'Máximo': df['CLTV'].max(),
        'Mínimo': df['CLTV'].min(),
        'Media': df['CLTV'].mean(),
        'Mediana': df['CLTV'].median(),
        'Desviación Estándar': df['CLTV'].std(),
        'Percentil 25': df['CLTV'].quantile(0.25),
        'Percentil 75': df['CLTV'].quantile(0.75)
    }
    
    # Mostrar estadísticas
    print("\nEstadísticas descriptivas del CLTV:")
    for key, value in stats.items():
        print(f"{key}: {value:.2f}")
    
    # Configurar estilo de los gráficos
    plt.style.use('seaborn')
    sns.set_palette("husl")
    
    # Crear figura con múltiples gráficos
    plt.figure(figsize=(15, 10))
    
    # Histograma
    plt.subplot(2, 2, 1)
    sns.histplot(df['CLTV'], bins=30, kde=True)
    plt.title('Distribución del CLTV')
    plt.xlabel('CLTV')
    plt.ylabel('Frecuencia')
    
    # Boxplot
    plt.subplot(2, 2, 2)
    sns.boxplot(y=df['CLTV'])
    plt.title('Diagrama de Caja del CLTV')
    plt.ylabel('CLTV')
    
    # Gráfico de densidad
    plt.subplot(2, 2, 3)
    sns.kdeplot(df['CLTV'], shade=True)
    plt.title('Densidad del CLTV')
    plt.xlabel('CLTV')
    plt.ylabel('Densidad')
    
    # Gráfico de percentiles
    plt.subplot(2, 2, 4)
    percentiles = df['CLTV'].quantile([0.1, 0.25, 0.5, 0.75, 0.9])
    percentiles.plot(kind='bar')
    plt.title('Percentiles del CLTV')
    plt.xlabel('Percentil')
    plt.ylabel('Valor CLTV')
    plt.xticks(rotation=0)
    
    plt.tight_layout()
    
    # Guardar gráficos
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    plt.savefig(f'cltv_analysis_{timestamp}.png')
    logging.info(f"Gráficos guardados como 'cltv_analysis_{timestamp}.png'")
    
    plt.show()

if __name__ == "__main__":
    logging.info("=== INICIO DEL ANÁLISIS CLTV ===")
    
    # Cargar datos
    cltv_data = load_cltv_data()
    
    # Analizar datos si se cargaron correctamente
    if cltv_data is not None:
        # Mostrar vista previa
        print("\nVista previa de los datos:")
        print(cltv_data.head())
        
        # Verificar nombres de columnas
        print("\nColumnas disponibles:", cltv_data.columns.tolist())
        
        # Realizar análisis
        analyze_cltv(cltv_data)
    
    logging.info("=== ANÁLISIS COMPLETADO ===")

2025-03-27 15:33:06,704 - INFO - === INICIO DEL ANÁLISIS CLTV ===
2025-03-27 15:33:06,718 - ERROR - Error al cargar datos CLTV: 'utf-8' codec can't decode byte 0xed in position 762: invalid continuation byte
2025-03-27 15:33:06,718 - INFO - === ANÁLISIS COMPLETADO ===


In [7]:
# Generales y manejo de datos
import pandas as pd
import numpy as np
import os
import logging

# Visualización
import matplotlib.pyplot as plt

# Conexión a SQL Server
import pyodbc  

In [8]:
# Configuración de logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

# Configuración de conexión a SQL Server LOCAL
LOCAL_SERVER = "localhost"
LOCAL_DATABASE = "master"
LOCAL_DRIVER = "{ODBC Driver 17 for SQL Server}"

local_conn_str = f"DRIVER={LOCAL_DRIVER};SERVER={LOCAL_SERVER};DATABASE={LOCAL_DATABASE};Trusted_Connection=yes;TrustServerCertificate=yes"

# Ruta a la carpeta con los archivos SQL
SQL_FOLDER_PATH = "../sql/CLTV/"
SQL_FILE = "SQLQuery_CLTV.sql"

# Leer la consulta desde el archivo SQL
with open(f"{SQL_FOLDER_PATH}{SQL_FILE}", "r", encoding="iso-8859-1") as file:
    query = file.read()

# Conectar a SQL Server y ejecutar la consulta
try:
    conn = pyodbc.connect(local_conn_str)
    df_CLTV = pd.read_sql(query, conn)
    conn.close()
    
    # Mostrar las primeras filas
    print(df_CLTV.head())
    
    logging.info("Consulta ejecutada exitosamente y convertida a DataFrame.")

except Exception as e:
    logging.error(f"Error al ejecutar la consulta: {e}")

  df_CLTV = pd.read_sql(query, conn)
2025-03-27 15:53:30,738 - ERROR - Error al ejecutar la consulta: 'NoneType' object is not iterable


In [12]:
import pyodbc
import pandas as pd
import logging

# Configuración de logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

def get_cltv_data():
    """Obtiene los datos CLTV desde SQL Server con manejo robusto de errores"""
    try:
        # Configuración de conexión
        LOCAL_SERVER = "localhost"
        LOCAL_DATABASE = "master"
        LOCAL_DRIVER = "{ODBC Driver 17 for SQL Server}"
        local_conn_str = f"DRIVER={LOCAL_DRIVER};SERVER={LOCAL_SERVER};DATABASE={LOCAL_DATABASE};Trusted_Connection=yes;TrustServerCertificate=yes"

        # Leer la consulta SQL
        SQL_FOLDER_PATH = "../sql/CLTV/"
        SQL_FILE = "SQLQuery_CLTV.sql"
        
        try:
            with open(f"{SQL_FOLDER_PATH}{SQL_FILE}", "r", encoding="iso-8859-1") as file:
                query = file.read()
        except FileNotFoundError:
            logging.error(f"Archivo SQL no encontrado en: {SQL_FOLDER_PATH}{SQL_FILE}")
            return None
        except Exception as e:
            logging.error(f"Error al leer el archivo SQL: {e}")
            return None

        # Establecer conexión
        try:
            conn = pyodbc.connect(local_conn_str)
            logging.info("Conexión a SQL Server establecida correctamente")
        except pyodbc.Error as e:
            logging.error(f"Error al conectar a SQL Server: {e}")
            return None

        # Ejecutar consulta y obtener datos
        try:
            df_CLTV = pd.read_sql(query, conn)
            logging.info(f"Datos CLTV obtenidos correctamente. Filas: {len(df_CLTV)}")
            return df_CLTV
        except Exception as e:
            logging.error(f"Error al ejecutar la consulta SQL: {e}")
            return None
        finally:
            conn.close()
            
    except Exception as e:
        logging.error(f"Error inesperado: {e}")
        return None

# Obtener los datos
df_CLTV = get_cltv_data()

# Mostrar resultados
if df_CLTV is not None:
    print("\nPrimeras filas del DataFrame CLTV:")
    print(df_CLTV.head())
    
    # Verificar columnas disponibles para análisis
    print("\nColumnas disponibles:")
    print(df_CLTV.columns.tolist())
else:
    print("No se pudieron obtener los datos CLTV. Verifica los logs para más detalles.")

2025-03-27 15:55:26,895 - INFO - Conexión a SQL Server establecida correctamente
  df_CLTV = pd.read_sql(query, conn)
2025-03-27 15:55:27,057 - ERROR - Error al ejecutar la consulta SQL: 'NoneType' object is not iterable


No se pudieron obtener los datos CLTV. Verifica los logs para más detalles.


In [None]:
import pyodbc
import pandas as pd
import logging
import matplotlib.pyplot as plt
import seaborn as sns

# Configuración de logging
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

def get_cltv_data():
    """Obtiene y limpia los datos CLTV"""
    try:
        # Configuración de conexión
        conn_str = (
            "DRIVER={ODBC Driver 17 for SQL Server};"
            "SERVER=localhost;"
            "DATABASE=master;"
            "Trusted_Connection=yes;"
            "TrustServerCertificate=yes"
        )
        
        # Leer consulta SQL
        with open("../sql/CLTV/SQLQuery_CLTV.sql", "r", encoding="iso-8859-1") as f:
            query = f.read()
        
        # Obtener datos
        conn = pyodbc.connect(conn_str)
        df = pd.read_sql(query, conn)
        conn.close()
        
        # Limpieza de datos
        df = clean_cltv_data(df)
        
        logging.info(f"Datos CLTV obtenidos. Filas: {len(df)}")
        return df
        
    except Exception as e:
        logging.error(f"Error: {str(e)}")
        return None

def clean_cltv_data(df):
    """Limpia y prepara los datos CLTV"""
    # Convertir None/NaN a 0 en columnas numéricas
    num_cols = df.select_dtypes(include=['number']).columns
    df[num_cols] = df[num_cols].fillna(0)
    
    # Eliminar filas con valores None críticos si es necesario
    df = df.dropna(subset=['CLTV'])  
    
    # Convertir tipos de datos
    df = df.convert_dtypes()
    
    return df

def analyze_cltv(df):
    """Realiza análisis básico del CLTV"""
    if df is None or df.empty:
        logging.error("No hay datos para analizar")
        return
    
    # Estadísticas básicas
    print("\nEstadísticas descriptivas del CLTV:")
    print(df.describe())
    
    # Configurar gráficos
    plt.figure(figsize=(15, 10))
    
    # Histograma
    plt.subplot(2, 2, 1)
    sns.histplot(df['CLTV'], bins=30, kde=True)
    plt.title('Distribución del CLTV')
    
    # Boxplot
    plt.subplot(2, 2, 2)
    sns.boxplot(y=df['CLTV'])
    plt.title('Diagrama de Caja del CLTV')
    
    # Gráfico de densidad
    plt.subplot(2, 2, 3)
    sns.kdeplot(df['CLTV'], fill=True)
    plt.title('Densidad del CLTV')
    
    # Gráfico de valores máximos/mínimos
    plt.subplot(2, 2, 4)
    df['CLTV'].agg(['max', 'min', 'mean']).plot(kind='bar')
    plt.title('Valores clave del CLTV')
    
    plt.tight_layout()
    plt.show()

# Flujo principal
if __name__ == "__main__":
    # Obtener datos
    df_cltv = get_cltv_data()
    
    # Mostrar datos si se obtuvieron correctamente
    if df_cltv is not None:
        print("\nPrimeras filas de los datos CLTV:")
        print(df_cltv.head())
        
        # Realizar análisis
        analyze_cltv(df_cltv)
    else:
        print("No se pudieron obtener los datos CLTV")

  df = pd.read_sql(query, conn)
2025-03-27 16:01:11,908 - ERROR - Error: 'NoneType' object is not iterable


No se pudieron obtener los datos CLTV


In [15]:
# SQL Server (entorno local)
LOCAL_SERVER = 'localhost'
LOCAL_DATABASE = 'master'
LOCAL_DRIVER = '{ODBC Driver 17 for SQL Server}'

# Construcción de cadena de conexión
local_conn_str = f"DRIVER={LOCAL_DRIVER};SERVER={LOCAL_SERVER};DATABASE={LOCAL_DATABASE};Trusted_Connection=yes;TrustServerCertificate=yes"
conn = pyodbc.connect(local_conn_str)

# Lectura de la consulta SQL desde archivo
with open("../sql/CLTV/SQLQuery_CLTV.sql", "r") as file:
    query = file.read()

# Ejecución de la consulta y carga del resultado en un DataFrame
df = pd.read_sql_query(query, conn)

  df = pd.read_sql_query(query, conn)


TypeError: 'NoneType' object is not iterable