**1. Introducción**

Nombre del proyecto: Business Intelligence Assistant para estudio de fitness en CDMX

Presentación del problema a abordar:

Un estudio de fitness en la Ciudad de México requiere una herramienta de business intelligence que les permita analizar el desempeño del negocio de forma sencilla, rápida y eficaz. El estudio busca una solución cuya curva de aprendizaje no requiera de un tiempo excesivo, que permita una interacción fluida y natural, y que no implique incurrir en gastos muy elevados.

Desarrollo de la propuesta de solución:

Mi objetivo es desarrollar un asistente inteligente que pueda analizar los datos recolectados por el estudio, encontrar correlaciones entre los data points, identificar tendencias, graficar los resultados, y hacer recomendaciones alineadas a los KPIs del estudio.

Justificación de la viabilidad del proyecto:

El proyecto está siendo desarrollado a la medida de acuerdo a las especificaciones del estudio, por lo que no se requiere desarrollar una solución integral que aborde más variables que las presentadas por el estudio. El carácter limitado de dichas variables facilita el desarrollo completo de la solución, de inicio a fin, en el tiempo establecido.

**2. Objetivos**

El objetivo central es desarrollar un asistente de negocios que permita una interacción fluida con el usuario para realizar un análisis detallado del desempeño del estudio. Este asistente debe poder:

Generar un análisis profundo de los datos de consumo de los clientes
Convertir el análisis en gráficas que identifiquen tendencias de consumo y tendencias ocultas
Convertir la correlación de datos en sugerencias de negocio específicas para el estudio

**3. Metodología**

Para llevar a cabo el desarrollo del asistente de negocios, los pasos a seguir son:

- Recopilación y Limpieza de Datos: Obtener información sobre la empresa (KPIs); obtener, revisar y limpiar los datos del negocio.
- Procesamiento de Texto: Utilizar GPT-4 para generar un documento que sirva como fuente de información única sobre la empresa y la marca.
- Procesamiento de Datos: Utilizar GPT-4 para analizar los datos y generar un resumen que presente tendencias de consumo y tendencias ocultas.
- Generación de Gráficas: Utilizar GPT-4 para generar gráficas como mapas de calor, gráficas de barras, gráficas de dispersión.
- Generación de Recomendaciones de Negocio: Utilizar GPT-4 para generar recomendaciones personalizadas de negocio (como promociones y gestión de horarios de clases) de acuerdo a la marca y la temporada.

**4. Herramientas y tecnologías**

El asistente, al tener una función específica y limitada al estudio, realizará few-shot prompting con el usuario, quien le ofrecerá un archivo que cumplirá la función del contexto. El asistente empleará dicho contexto para desarrollar sus respuestas.

Características del asistente en su versión actual

Versión de Python: Python 3.10.16

Librerías específicas necesarias para el desarrollo del asistente:
- Pandas
- Openai (version 0.28.0)
- Plotly

**5. Implementación:**

Nota: En el repositorio pueden encontrarse un archivo .txt y un .csv, usarlos para probar el código

In [None]:
import pandas as pd
import openai
import plotly.express as px

# Set your OpenAI API key directly
openai.api_key = "your_openai_api_key"  # Replace with your actual API key

# Function to load context from a .txt file
def load_context(filepath):
    try:
        with open(filepath, 'r', encoding='utf-8') as file:
            return file.read()
    except Exception as e:
        print(f"Error loading context file: {e}")
        return "You are a helpful assistant for analyzing datasets."

# Function to load a dataset from a CSV file
def load_data(filepath):
    try:
        df = pd.read_csv(filepath)
        print("Dataset loaded successfully! Here's a preview:")
        print(df.head())
        return df
    except Exception as e:
        print(f"Error loading dataset: {e}")
        return None

# Function to interact with OpenAI API
def ask_openai(question, df_summary, context):
    messages = [
        {"role": "system", "content": f"{context}\nHere is the dataset summary:\n{df_summary}"},
        {"role": "user", "content": question},
    ]
    try:
        # API call (compatible with OpenAI version 0.28)
        response = openai.ChatCompletion.create(
            model="gpt-3.5-turbo",
            messages=messages,
            max_tokens=500,
            temperature=0
        )
        return response['choices'][0]['message']['content']
    except Exception as e:
        return f"Error: {e}"

# Function to summarize the dataset
def summarize_data(df):
    return df.describe(include="all").to_string()

# Function to generate graphs
def generate_graph(df):
    try:
        print("\nGraph Types: bar, scatter, heatmap")
        graph_type = input("Enter the graph type: ").strip().lower()

        if graph_type == "bar":
            x_column = input("Enter the column name for X-axis: ").strip()
            y_column = input("Enter the column name for Y-axis: ").strip()
            fig = px.bar(df, x=x_column, y=y_column, title="Bar Chart")
            fig.show()
        elif graph_type == "scatter":
            x_column = input("Enter the column name for X-axis: ").strip()
            y_column = input("Enter the column name for Y-axis: ").strip()
            fig = px.scatter(df, x=x_column, y=y_column, title="Scatter Plot")
            fig.show()
        elif graph_type == "heatmap":
            fig = px.imshow(df.corr(), text_auto=True, title="Heatmap")
            fig.show()
        else:
            print("Unsupported graph type. Try 'bar', 'scatter', or 'heatmap'.")
    except Exception as e:
        print(f"Error generating graph: {e}")

# Main interactive chat function
def interactive_chat(df, context):
    print("\nWelcome to the Interactive Data Chat!")
    print("Type 'graph' to create a graph or 'exit' to quit the chat.\n")
    df_summary = summarize_data(df)

    while True:
        user_input = input("Ask a question about the dataset (or type 'graph'): ").strip()
        if user_input.lower() == "exit":
            print("Exiting the chat. Goodbye!")
            break
        elif user_input.lower() == "graph":
            generate_graph(df)
        else:
            response = ask_openai(user_input, df_summary, context)
            print(f"\nAnswer: {response}\n")

# Main function to load files and start the chat
def main():
    # Prompt user for file paths
    context_path = input("Enter the path to your context .txt file: ").strip()
    data_path = input("Enter the path to your CSV file: ").strip()

    # Load context and data
    context = load_context(context_path)
    df = load_data(data_path)

    # Start interactive chat if files loaded successfully
    if df is not None:
        interactive_chat(df, context)
    else:
        print("Failed to load files. Exiting.")

# Run the script
if __name__ == "__main__":
    main()

**Apéndice**

*Tipos de gráficas soportadas:*

Bar Chart (Gráfica de barras)
Datos requeridos:
Nombre de la columna para el eje X.
Nombre de la columna para el eje Y.

Scatter Plot (Gráfica de dispersión):
Datos requeridos:
Nombre de la columna para el eje X.
Nombre de la columna para el eje Y.

Heatmap (Mapa de calor):
Datos automáticos:
No se necesita entrada del usuario. El script genera el mapa de calor basado en las columnas numéricas.

*Ejemplo para generar una gráfica:*
Cuando estés en el chat interactivo:

Entrada:

Ask a question about the dataset (or type 'graph'): graph  
Enter the graph type: bar  
Columnas disponibles: name, age, city, spending  
Enter the column name for X-axis: name  
Enter the column name for Y-axis: spending  


Salida:
Aparecerá una gráfica de barras mostrando los valores de gasto para cada nombre.

Notas Importantes:
Asegúrate de que los nombres de las columnas coincidan exactamente con los de tu dataset (distingue mayúsculas y minúsculas).
Para la gráfica heatmap, el dataset debe tener al menos dos columnas numéricas para mostrar resultados significativos.