In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.backends.backend_pdf import PdfPages
from matplotlib.dates import DateFormatter
from matplotlib.ticker import MaxNLocator
from datetime import datetime, timedelta
import random
import os
import shutil
import matplotlib.patches as mpatches  # Para la leyenda personalizada
import seaborn as sns  # Necesario para el diagrama de violín

# ===================== Generación de Nombres de Archivo =====================

def generar_nombre_archivo_PDF_violin():
    """
    Genera un nombre de archivo para un análisis de ventas en formato PDF (tipo violín).
    
    :return: Nombre del archivo con formato de fecha y hora actual.
    """
    fecha_hora_actual = datetime.now().strftime('%Y-%m-%d_%H-%M-%S')
    nombre_archivo = f"analisis-ventas-violin-{fecha_hora_actual}.pdf"
    return nombre_archivo


def generar_nombre_archivo_PDF_bubbles():
    """
    Genera un nombre de archivo para un análisis de ventas en formato PDF (tipo burbujas).
    
    :return: Nombre del archivo con formato de fecha y hora actual.
    """
    fecha_hora_actual = datetime.now().strftime('%Y-%m-%d_%H-%M-%S')
    nombre_archivo = f"analisis-ventas-burbujas-{fecha_hora_actual}.pdf"
    return nombre_archivo


def generar_nombre_archivo_PDF():
    """
    Genera un nombre de archivo para un análisis de ventas segmentadas en formato PDF.
    
    :return: Nombre del archivo con formato de fecha y hora actual.
    """
    fecha_hora_actual = datetime.now().strftime('%Y-%m-%d_%H-%M-%S')
    nombre_archivo = f"analisis-ventas-segmentadas-{fecha_hora_actual}.pdf"
    return nombre_archivo


def generar_nombre_archivo_Excel():
    """
    Genera un nombre de archivo para un análisis de ventas en formato Excel.
    
    :return: Nombre del archivo con formato de fecha y hora actual.
    """
    fecha_hora_actual = datetime.now().strftime('%Y-%m-%d_%H-%M-%S')
    nombre_archivo = f"analisis-ventas-segmentadas-{fecha_hora_actual}.xlsx"
    return nombre_archivo


def generar_nombre_archivo_PDF_type_products():
    """
    Genera un nombre de archivo para un análisis de ventas por productos en formato PDF.
    
    :return: Nombre del archivo con formato de fecha y hora actual.
    """
    fecha_hora_actual = datetime.now().strftime('%Y-%m-%d_%H-%M-%S')
    nombre_archivo = f"analisis-ventas-productos-{fecha_hora_actual}.pdf"
    return nombre_archivo


# ===================== Búsqueda de Archivos en el Directorio =====================

def buscar_archivos_analisis():
    """
    Busca archivos de análisis de ventas en el directorio actual que comiencen con un prefijo específico.
    
    :return: Lista de archivos encontrados.
    """
    prefijo = "Analisis de Ventas por Tickets"
    archivos_encontrados = [archivo for archivo in os.listdir() if archivo.startswith(prefijo)]
    return archivos_encontrados


# ===================== Generación de Colores Aleatorios =====================

def color_aleatorio(excluir=None, used_colors=None):
    """
    Genera un color aleatorio excluyendo colores específicos.
    
    :param excluir: Color que se desea excluir de la selección (opcional).
    :param used_colors: Lista de colores ya utilizados que deben ser evitados (opcional).
    :return: Color aleatorio de la lista disponible.
    """
    colores = [
        "red", "green", "blue", "black", "orange", "gray", 
        "purple", "pink", "yellow", "cyan", "magenta", "lime", 
        "indigo", "brown", "gold", "teal", "navy", "coral"
    ]
    
    # Excluir el color pasado como parámetro
    if excluir and excluir in colores:
        colores.remove(excluir)
    
    # Excluir colores que ya han sido utilizados
    if used_colors:
        colores = [color for color in colores if color not in used_colors]
    
    # Elegir un color aleatorio del conjunto disponible
    return random.choice(colores)


# ===================== Asignar Colores a Categorías =====================

def asignar_colores_por_categoria(df_almacen):
    """
    Asigna colores únicos a cada categoría en un DataFrame.

    :param df_almacen: DataFrame con una columna 'Categoria'.
    :return: DataFrame actualizado con la columna 'Color' y un diccionario con la asignación de colores.
    """
    # Obtener las categorías únicas en el DataFrame
    categorias_unicas = df_almacen['Categoria'].unique()
    colores = {}
    used_colors = []
    
    # Asignar colores a cada categoría
    for categoria in categorias_unicas:
        color = color_aleatorio(used_colors=used_colors)
        colores[categoria] = color
        used_colors.append(color)  # Marcar el color como utilizado
    
    # Mapear los colores al DataFrame
    df_almacen['Color'] = df_almacen['Categoria'].map(colores)
    
    # Devolver el DataFrame actualizado y el diccionario de colores
    return df_almacen, colores


# # Leer el archivo Excel (reemplaza 'salvamedelolvido.xlsx' con la ruta a tu archivo)
# file_path = buscar_archivos_analisis()[0]
# df = pd.read_excel(file_path)

# # Crear un nuevo DataFrame con las columnas solicitadas
# df_mapped = df[['Almacen', 'Fecha', 'TotalVenta']]

# # Convertir la columna 'Fecha' a datetime, asegurando el formato correcto
# df_mapped['Fecha'] = pd.to_datetime(df_mapped['Fecha'], format='%b %d %Y %I:%M%p')

# # Crear una columna auxiliar con solo la fecha (sin horas) y otra con la hora redondeada a la hora completa
# df_mapped['FechaDia'] = df_mapped['Fecha'].dt.date
# df_mapped['FechaHoraRedondeada'] = df_mapped['Fecha'].dt.floor('H')

# df_almacenesCopy = df_mapped.copy(deep=True)


# # Agrupar por Almacen y por la fecha con la hora redondeada
# df_grouped = df_mapped.groupby(['Almacen', 'FechaHoraRedondeada']).agg({'TotalVenta': 'mean'}).reset_index()

# # Renombrar la columna de TotalVenta para indicar que es un promedio
# df_grouped = df_grouped.rename(columns={'TotalVenta': 'PromedioTotalVenta'})

# nombreArchivo = generar_nombre_archivo_PDF()

# # Crear un PDF para exportar las gráficas
# with PdfPages(nombreArchivo) as pdf:

#     # Para cada sucursal, crear una gráfica individual y guardarla en el PDF
#     for i, almacen in enumerate(df_grouped['Almacen'].unique()):

#         color = color_aleatorio()
#         # Filtrar los datos por almacén
#         df_almacen = df_grouped[df_grouped['Almacen'] == almacen]

#         # Añadir la columna de fecha sin horas para agrupar por día
#         df_almacen['FechaDia'] = df_almacen['FechaHoraRedondeada'].dt.date

#         # Obtener el valor máximo de venta para cada día
#         df_max = df_almacen.loc[df_almacen.groupby('FechaDia')['PromedioTotalVenta'].idxmax()]

#         # Filtrar el DataFrame por el almacén seleccionado y obtener el promedio de 'TotalVenta'
#         promedio_almacen_seleccionado = df_almacenesCopy[df_almacenesCopy['Almacen'] == almacen]['TotalVenta'].mean()



#         # Crear una figura para la gráfica de cada almacén
#         plt.figure(figsize=(12, 6))

#         # Graficar los valores máximos de cada almacén como puntos
#         plt.plot(df_max['FechaHoraRedondeada'], df_max['PromedioTotalVenta'], label=almacen, color=color, marker='o')

#         # Dibujar una línea horizontal que indique el promedio de ventas
#         plt.axhline(y=promedio_almacen_seleccionado, color=color_aleatorio(), linestyle='--', label=f'Ticket promedio: {promedio_almacen_seleccionado:.2f}')

#         # Asegurarse de que la leyenda se muestre
#         plt.legend(loc='upper right')  # Puedes ajustar la ubicación de la leyenda según prefieras

#         # Alternar la posición de las etiquetas para evitar superposición
#         for j, row in df_max.iterrows():
#             fecha_hora = row['FechaHoraRedondeada'].strftime('%d/%m/%Y\n%H:%M')
#             if j % 2 == 0:
#                 plt.annotate(fecha_hora, (row['FechaHoraRedondeada'], row['PromedioTotalVenta']),
#                              textcoords="offset points", xytext=(0,10), ha='center', fontsize=5, color=color)
#             else:
#                 plt.annotate(fecha_hora, (row['FechaHoraRedondeada'], row['PromedioTotalVenta']),
#                              textcoords="offset points", xytext=(0,-15), ha='center', fontsize=5, color=color)

#         # Añadir títulos y etiquetas
#         plt.title(f'Promedio de Ventas Máximo en: {almacen}')
#         plt.xlabel('Fecha')
#         plt.ylabel('Promedio Total de Venta Máximo')

#         # Formatear el eje X para mostrar solo los días
#         ax = plt.gca()
#         ax.xaxis.set_major_formatter(DateFormatter('%b %d'))
#         ax.xaxis.set_major_locator(MaxNLocator(integer=True))  # Asegurarse de mostrar todas las fechas

#         # Rotar las etiquetas del eje X y ajustar el tamaño de la fuente
#         plt.xticks(rotation=45, ha='right', fontsize=6)  # Reducir tamaño de la fuente

        # # Ajustar márgenes
        # plt.tight_layout()


        # # Añadir texto en el pie de la gráfica
        # plt.figtext(0.5, 0.01, 'Esta grafica representa los picos máximos de ventas por día y la hora en la que ocurrió ese pico. \nLa linea punteada representa el ticket promedio durante el periodo mostrado.', 
        #             ha='left', fontsize=8, color='gray')
        
        # # Guardar la gráfica en el archivo PDF
        # pdf.savefig()
        # plt.close()

# Leer el archivo Excel (reemplaza 'salvamedelolvido.xlsx' con la ruta a tu archivo)
file_path = buscar_archivos_analisis()[0]  # Se obtiene la ruta del archivo a través de una función personalizada
df = pd.read_excel(file_path)  # Se carga el archivo Excel en un DataFrame de pandas

# Crear un nuevo DataFrame con las columnas solicitadas ('Almacen', 'Fecha', 'TotalVenta')
df_mapped = df[['Almacen', 'Fecha', 'TotalVenta']]

# Convertir la columna 'Fecha' a formato datetime, asegurando el formato correcto
df_mapped['Fecha'] = pd.to_datetime(df_mapped['Fecha'], format='%b %d %Y %I:%M%p')

# Crear columnas adicionales:
# 'FechaDia' almacena solo la fecha (sin hora)
# 'FechaHoraRedondeada' redondea la hora hacia abajo (al inicio de la hora)
df_mapped['FechaDia'] = df_mapped['Fecha'].dt.date
df_mapped['FechaHoraRedondeada'] = df_mapped['Fecha'].dt.floor('H')

# Hacer una copia profunda del DataFrame para conservar los datos originales
df_almacenesCopy = df_mapped.copy(deep=True)

# Agrupar por 'Almacen' y 'FechaHoraRedondeada', calculando el promedio de 'TotalVenta'
df_grouped = df_mapped.groupby(['Almacen', 'FechaHoraRedondeada']).agg({'TotalVenta': 'mean'}).reset_index()

# Renombrar la columna 'TotalVenta' para reflejar que es un promedio
df_grouped = df_grouped.rename(columns={'TotalVenta': 'PromedioTotalVenta'})

# Generar el nombre del archivo PDF donde se guardarán las gráficas
nombreArchivo = generar_nombre_archivo_PDF()

# Crear un archivo PDF para exportar las gráficas
with PdfPages(nombreArchivo) as pdf:
    
    # Iterar sobre cada almacén único para generar gráficas individuales
    for i, almacen in enumerate(df_grouped['Almacen'].unique()):
        
        color = color_aleatorio()  # Generar un color aleatorio para cada gráfica
        # Filtrar los datos del DataFrame agrupado por almacén
        df_almacen = df_grouped[df_grouped['Almacen'] == almacen]
        
        # Añadir la columna 'FechaDia' (sin horas) para agrupar por día
        df_almacen['FechaDia'] = df_almacen['FechaHoraRedondeada'].dt.date
        
        # Obtener el valor máximo de 'PromedioTotalVenta' para cada día
        df_max = df_almacen.loc[df_almacen.groupby('FechaDia')['PromedioTotalVenta'].idxmax()]
        
        # Calcular el promedio general de ventas para el almacén actual
        promedio_almacen_seleccionado = df_almacenesCopy[df_almacenesCopy['Almacen'] == almacen]['TotalVenta'].mean()
        
        # Crear una figura para la gráfica del almacén actual
        plt.figure(figsize=(12, 6))
        
        # Graficar los picos máximos de ventas por día como puntos
        plt.plot(df_max['FechaHoraRedondeada'], df_max['PromedioTotalVenta'], label=almacen, color=color, marker='o')
        
        # Dibujar una línea horizontal representando el ticket promedio
        plt.axhline(y=promedio_almacen_seleccionado, color=color_aleatorio(), linestyle='--', 
                    label=f'Ticket promedio: {promedio_almacen_seleccionado:.2f}')
        
        # Mostrar la leyenda (identificación de almacén y línea de promedio)
        plt.legend(loc='upper right')  # La leyenda se coloca en la esquina superior derecha
        
        # Evitar que las etiquetas de datos se sobrepongan alternando su posición
        for j, row in df_max.iterrows():
            fecha_hora = row['FechaHoraRedondeada'].strftime('%d/%m/%Y\n%H:%M')  # Formato de fecha y hora
            if j % 2 == 0:  # Alternar etiquetas hacia arriba
                plt.annotate(fecha_hora, (row['FechaHoraRedondeada'], row['PromedioTotalVenta']),
                             textcoords="offset points", xytext=(0, 10), ha='center', fontsize=5, color=color)
            else:  # Alternar etiquetas hacia abajo
                plt.annotate(fecha_hora, (row['FechaHoraRedondeada'], row['PromedioTotalVenta']),
                             textcoords="offset points", xytext=(0, -15), ha='center', fontsize=5, color=color)
        
        # Añadir títulos y etiquetas a la gráfica
        plt.title(f'Promedio de Ventas Máximo en: {almacen}')
        plt.xlabel('Fecha')
        plt.ylabel('Promedio Total de Venta Máximo')
        
        # Formatear el eje X para mostrar solo los días
        ax = plt.gca()
        ax.xaxis.set_major_formatter(DateFormatter('%b %d'))  # Mostrar solo día y mes
        ax.xaxis.set_major_locator(MaxNLocator(integer=True))  # Asegurarse de mostrar todas las fechas
        
        # Rotar etiquetas del eje X para mayor legibilidad
        plt.xticks(rotation=45, ha='right', fontsize=6)
        
        # Ajustar márgenes para evitar que se corte el contenido
        plt.tight_layout()
        
        # Añadir una nota explicativa en el pie de la gráfica
        plt.figtext(0.5, 0.01, 'Esta gráfica representa los picos máximos de ventas por día y la hora en la que ocurrió ese pico. \nLa línea punteada representa el ticket promedio durante el periodo mostrado.', 
                    ha='left', fontsize=8, color='gray')
        
        # Guardar la gráfica en el PDF
        pdf.savefig()
        plt.close()  # Cerrar la figura para liberar memoria


# Leer el archivo Excel y cargarlo en un DataFrame
df = pd.read_excel(file_path)

# Crear un nuevo DataFrame con las columnas necesarias ('Almacen', 'Fecha', 'TotalVenta')
df_mapped = df[['Almacen', 'Fecha', 'TotalVenta']]

# Convertir la columna 'Fecha' a formato datetime, asegurando el formato esperado
df_mapped['Fecha'] = pd.to_datetime(df_mapped['Fecha'], format='%b %d %Y %I:%M%p')

# Añadir columnas auxiliares:
# 'FechaDia' contiene solo la fecha (sin hora)
# 'FechaHoraRedondeada' redondea la hora hacia abajo (al inicio de la hora)
df_mapped['FechaDia'] = df_mapped['Fecha'].dt.date
df_mapped['FechaHoraRedondeada'] = df_mapped['Fecha'].dt.floor('H')

# Hacer una copia profunda del DataFrame para conservar los datos originales
df_almacenesCopy = df_mapped.copy(deep=True)

# Agrupar los datos por almacén y hora redondeada, calculando el promedio de 'TotalVenta'
df_grouped = df_mapped.groupby(['Almacen', 'FechaHoraRedondeada']).agg({'TotalVenta': 'mean'}).reset_index()

# Renombrar la columna 'TotalVenta' a 'PromedioTotalVenta' para mayor claridad
df_grouped = df_grouped.rename(columns={'TotalVenta': 'PromedioTotalVenta'})

# Obtener los nombres únicos de almacenes para crear hojas separadas en Excel
almacenes_unicos = df_grouped['Almacen'].unique()

# Crear una lista de DataFrames filtrados, uno por cada almacén
dfs_por_almacen = [df_grouped[df_grouped['Almacen'] == almacen] for almacen in almacenes_unicos]

# Generar el nombre del archivo Excel de salida
output_file = generar_nombre_archivo_Excel()

# Escribir los DataFrames en un archivo Excel, cada uno en una hoja distinta
with pd.ExcelWriter(output_file, engine='xlsxwriter') as writer:
    for i, df_almacen in enumerate(dfs_por_almacen):
        # Limitar el nombre de la hoja a 30 caracteres (límite de Excel)
        nombre_hoja = almacenes_unicos[i][:30]
        
        # Escribir el DataFrame correspondiente en una hoja
        df_almacen.to_excel(writer, sheet_name=nombre_hoja, index=False)

# ------------------------------------------------------------
# Volver a cargar el archivo Excel (parece redundante, pero podría usarse en otra sección)
file_path = buscar_archivos_analisis()[0]
df = pd.read_excel(file_path)

# Repetir el mapeo de columnas y la conversión de fechas
df_mapped = df[['Almacen', 'Fecha', 'TotalVenta']]
df_mapped['Fecha'] = pd.to_datetime(df_mapped['Fecha'], format='%b %d %Y %I:%M%p')
df_mapped['FechaDia'] = df_mapped['Fecha'].dt.date
df_mapped['FechaHoraRedondeada'] = df_mapped['Fecha'].dt.floor('H')

# Agrupar nuevamente los datos por almacén y hora redondeada, calculando el promedio
df_grouped = df_mapped.groupby(['Almacen', 'FechaHoraRedondeada']).agg({'TotalVenta': 'mean'}).reset_index()
df_grouped = df_grouped.rename(columns={'TotalVenta': 'PromedioTotalVenta'})

# Obtener los almacenes únicos para graficar
almacenes_unicos = df_grouped['Almacen'].unique()

# Generar el nombre del archivo PDF para gráficas de burbujas
nombre_pdfBble = generar_nombre_archivo_PDF_bubbles()

# Crear el PDF con gráficas de burbujas
with PdfPages(nombre_pdfBble) as pdf:
    # Generar una gráfica para cada almacén
    for almacen in almacenes_unicos:
        # Filtrar los datos para el almacén actual
        df_almacen = df_grouped[df_grouped['Almacen'] == almacen]
        
        # Añadir la columna 'FechaDia' para agrupar por día
        df_almacen['FechaDia'] = df_almacen['FechaHoraRedondeada'].dt.date

        # Obtener el máximo de ventas diarias (pico de ventas por día)
        df_max = df_almacen.loc[df_almacen.groupby('FechaDia')['PromedioTotalVenta'].idxmax()]

        # Crear una nueva figura para la gráfica
        plt.figure(figsize=(12, 6))

        # Generar color aleatorio para el gráfico de burbujas
        colorG = color_aleatorio()

        # Crear gráfico de dispersión (scatter), el tamaño de las burbujas depende de las ventas
        plt.scatter(df_max['FechaHoraRedondeada'], df_max['FechaHoraRedondeada'].dt.hour, 
                    s=[v * 10 for v in df_max['PromedioTotalVenta']],  # Tamaño de burbuja proporcional a ventas
                    c=colorG, alpha=0.6)  # Transparencia de burbujas

        # Calcular las horas más rentables con ventas en el 75% superior
        horas_rentables = df_max.groupby(df_max['FechaHoraRedondeada'].dt.hour)['PromedioTotalVenta'].mean()
        umbral = horas_rentables.quantile(0.75)

        # Resaltar visualmente las horas con ventas superiores al umbral
        colorHR = color_aleatorio(excluir=colorG)  # Evitar que el color sea igual al de las burbujas
        for hour in horas_rentables.index:
            if horas_rentables[hour] > umbral:
                plt.axhline(y=hour, color=colorHR, linestyle='--', alpha=0.5, 
                            label=f'Acumulación de ventas')  # Línea para horas de alta venta

        # Añadir títulos y etiquetas
        plt.title(f'Mapa de ventas: {almacen}')
        plt.xlabel('Fecha')
        plt.ylabel('Hora del Día')

        # Formatear el eje X para mostrar día y mes
        ax = plt.gca()
        ax.xaxis.set_major_formatter(DateFormatter('%b %d'))
        ax.xaxis.set_major_locator(MaxNLocator(integer=True))

        # Mostrar leyenda
        plt.legend(loc='upper right')
        
        # Rotar etiquetas del eje X para mejorar la legibilidad
        plt.xticks(rotation=45, ha='right', fontsize=8)

        # Ajustar los márgenes
        plt.tight_layout()

        # Guardar la gráfica en el archivo PDF
        pdf.savefig()

        # Cerrar la gráfica para liberar memoria
        plt.close()

# Leer el archivo Excel (se obtiene la ruta del archivo con una función personalizada)
file_path = buscar_archivos_analisis()[0]  # Se asume que la función devuelve una lista de archivos y se selecciona el primero
df = pd.read_excel(file_path)  # Cargar el archivo Excel en un DataFrame de pandas

# Crear un nuevo DataFrame con las columnas necesarias ('Almacen', 'Fecha', 'TotalVenta', 'N1', 'N2', 'N3')
df_mapped = df[['Almacen', 'Fecha', 'TotalVenta', 'N1', 'N2', 'N3']]

# Crear la columna 'Categoria' concatenando las columnas N1, N2 y N3 (jerarquía de productos o categorías)
df_mapped['Categoria'] = df_mapped['N1'] + '->' + df_mapped['N2'] + '->' + df_mapped['N3']

# Convertir la columna 'Fecha' a tipo datetime, asegurando el formato correcto
df_mapped['Fecha'] = pd.to_datetime(df_mapped['Fecha'], format='%b %d %Y %I:%M%p')

# Crear una nueva columna 'FechaSoloDia' que solo contiene la fecha (sin horas)
df_mapped['FechaSoloDia'] = df_mapped['Fecha'].dt.date

# Redondear la columna 'Fecha' a la hora más cercana (eliminando minutos y segundos)
df_mapped['FechaHoraRedondeada'] = df_mapped['Fecha'].dt.floor('H')

# Agrupar por almacén, categoría, fecha y hora redondeada, calculando el promedio de ventas
df_grouped = df_mapped.groupby(['Almacen', 'Categoria', 'FechaSoloDia', 'FechaHoraRedondeada']).agg({'TotalVenta': 'mean'}).reset_index()

# Filtrar las ventas máximas por almacén y fecha (sin importar la hora específica)
df_max_ventas = df_grouped.loc[df_grouped.groupby(['Almacen', 'FechaSoloDia'])['TotalVenta'].idxmax()].reset_index(drop=True)

# Generar el nombre del archivo PDF donde se guardarán las gráficas
nombre_pdfProductosGraph = generar_nombre_archivo_PDF_type_products()

# Crear un archivo PDF que contendrá las gráficas de ventas máximas
with PdfPages(nombre_pdfProductosGraph) as pdf:
    # Obtener los nombres únicos de almacenes
    almacenes_unicos = df_max_ventas['Almacen'].unique()
    
    # Iterar sobre cada almacén para crear gráficas individuales
    for almacen in almacenes_unicos:
        # Filtrar los datos del DataFrame para el almacén actual
        df_almacen = df_max_ventas[df_max_ventas['Almacen'] == almacen]
        
        # Asignar colores únicos a cada categoría dentro del almacén (la función devuelve DataFrame y diccionario de colores)
        df_almacen, color_dict = asignar_colores_por_categoria(df_almacen)
        
        # Crear una nueva figura para la gráfica
        plt.figure(figsize=(10, 6))
        
        # Graficar los puntos de venta, coloreados según la categoría del producto
        plt.scatter(df_almacen['FechaSoloDia'], df_almacen['FechaHoraRedondeada'].dt.hour, 
                    color=df_almacen['Color'], s=100)  # Tamaño del punto = 100
        
        # Añadir etiquetas que muestran el total de venta en cada punto del gráfico
        for i, row in df_almacen.iterrows():
            plt.annotate(f"${row['TotalVenta']:.2f}",  # Formato de etiqueta en dólares con 2 decimales
                         (row['FechaSoloDia'], row['FechaHoraRedondeada'].hour),  # Posición del texto
                         textcoords="offset points", xytext=(0,10),  # Desplazar etiqueta hacia arriba
                         ha='center', fontsize=5)  # Tamaño de la fuente pequeño
        
        # Configuración de ejes y títulos
        plt.title(f'Almacén: {almacen}')  # Título de la gráfica
        plt.xlabel('Fecha')  # Etiqueta del eje X
        plt.ylabel('Hora del día')  # Etiqueta del eje Y
        
        # Rotar las etiquetas de fechas en el eje X para mayor legibilidad
        plt.xticks(rotation=45)
        
        # Formatear las etiquetas del eje X para mostrar solo mes y día (ej: Sep 21)
        plt.gca().xaxis.set_major_formatter(DateFormatter('%b %d'))
        
        # Crear una leyenda con base en los colores asignados a cada categoría
        leyenda_patches = [mpatches.Patch(color=color, label=categoria) for categoria, color in color_dict.items()]
        plt.legend(handles=leyenda_patches, title="Categorías", loc='upper right', fontsize=5)
        
        # Ajustar el formato y márgenes del gráfico para que no se corte al exportar
        plt.tight_layout()
        
        # Guardar la gráfica en el archivo PDF
        pdf.savefig()
        
        # Cerrar la figura para liberar memoria
        plt.close()

# Leer el archivo Excel (se obtiene la ruta del archivo usando una función personalizada)
file_path = buscar_archivos_analisis()[0]  # Se asume que la función devuelve una lista de archivos y se selecciona el primero
df = pd.read_excel(file_path)  # Cargar el archivo Excel en un DataFrame de pandas

# Crear un nuevo DataFrame con las columnas necesarias ('Almacen', 'Fecha', 'TotalVenta', 'N1', 'N2', 'N3')
df_mapped = df[['Almacen', 'Fecha', 'TotalVenta', 'N1', 'N2', 'N3']]

# Crear una nueva columna 'Categoria' concatenando N1, N2 y N3 (representa jerarquía de productos)
df_mapped['Categoria'] = df_mapped['N1'] + '->' + df_mapped['N2'] + '->' + df_mapped['N3']

# Convertir la columna 'Fecha' a tipo datetime para facilitar el manejo de fechas y horas
df_mapped['Fecha'] = pd.to_datetime(df_mapped['Fecha'], format='%b %d %Y %I:%M%p')

# Extraer solo la hora de la columna 'Fecha' y almacenarla en una nueva columna 'Hora'
df_mapped['Hora'] = df_mapped['Fecha'].dt.hour

# Generar el nombre del archivo PDF donde se guardarán las gráficas
nombre_pdfViolinGraph = generar_nombre_archivo_PDF_violin()

# Crear un archivo PDF para guardar diagramas de violín
with PdfPages(nombre_pdfViolinGraph) as pdf:
    # Obtener los nombres únicos de almacenes
    almacenes_unicos = df_mapped['Almacen'].unique()
    
    # Iterar sobre cada almacén para generar un diagrama de violín individual
    for almacen in almacenes_unicos:
        # Filtrar el DataFrame para obtener solo los registros del almacén actual
        df_almacen = df_mapped[df_mapped['Almacen'] == almacen]
        
        # Crear una nueva figura para el gráfico
        plt.figure(figsize=(10, 6))
        
        # Crear el diagrama de violín usando seaborn
        # - Muestra la distribución de las horas de venta por categoría
        sns.violinplot(x='Categoria', y='Hora', data=df_almacen, scale='width', palette='Set3')
        
        # Configurar título, etiquetas y formato de los ejes
        plt.title(f'Diagrama de Violín de Horas de Venta por Categoría en: {almacen}', fontsize=10)
        plt.xlabel('Categoría', fontsize=5)
        plt.ylabel('Hora del día', fontsize=6)
        
        # Rotar las etiquetas del eje X (categorías) para evitar superposición
        plt.xticks(rotation=90, fontsize=5)
        
        # Ajustar el tamaño de las etiquetas del eje Y (horas)
        plt.yticks(fontsize=8)
        
        # Ajustar automáticamente los márgenes y el diseño para evitar cortes en el gráfico
        plt.tight_layout()
        
        # Guardar la gráfica en el PDF
        pdf.savefig()
        
        # Cerrar la figura actual para liberar memoria y pasar a la siguiente iteración
        plt.close()


# Generar el nombre de la carpeta basado en la fecha y hora actuales
carpeta_nombre = f"ANALISIS-{datetime.now().strftime('%Y-%m-%d_%H-%M-%S')}"

# Crear la carpeta
if not os.path.exists(carpeta_nombre):
    os.makedirs(carpeta_nombre)

# Mover los archivos PDF y Excel generados a la nueva carpeta
shutil.move(nombreArchivo, os.path.join(carpeta_nombre, os.path.basename(nombreArchivo)))
shutil.move(output_file, os.path.join(carpeta_nombre, os.path.basename(output_file)))
shutil.move(file_path, os.path.join(carpeta_nombre, os.path.basename(file_path)))
shutil.move(nombre_pdfBble, os.path.join(carpeta_nombre, os.path.basename(nombre_pdfBble)))
shutil.move(nombre_pdfProductosGraph, os.path.join(carpeta_nombre, os.path.basename(nombre_pdfProductosGraph)))
shutil.move(nombre_pdfViolinGraph, os.path.join(carpeta_nombre, os.path.basename(nombre_pdfViolinGraph)))

