Skip to content

💡 An AI-powered Streamlit app that lets you analyze CSV files through natural language questions. 🧠 Automatically generates pandas code, validates your queries, and visualizes data instantly.

Notifications You must be signed in to change notification settings

IreHurtado/data-assistant

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

💜 Data Assistant – Analiza tus CSV con IA

Data Assistant es una aplicación interactiva creada con Streamlit y OpenAI, que permite analizar cualquier archivo CSV mediante preguntas en lenguaje natural.
El sistema interpreta tus consultas, genera código pandas dinámicamente y visualiza los resultados de forma automática.


🚀 Características principales

  • 🧠 IA integrada: interpreta tus preguntas y genera consultas pandas automáticamente.
  • 📊 Visualización automática: muestra tablas y gráficos según el contexto del análisis.
  • 🔍 Validación inteligente: evita llamadas innecesarias a la IA cuando la pregunta no está relacionada con las columnas del dataset.
  • Interfaz sencilla: construida con Streamlit y un tema visual personalizado (styles/theme.css).
  • 🧩 Arquitectura modular: organizada en carpetas para facilitar mantenimiento y ampliaciones.

🧱 Estructura del proyecto

data-assistant/ │ ├── app.py # Archivo principal de la aplicación Streamlit ├── .env # Variables de entorno (API Key) ├── requirements.txt # Dependencias del proyecto │ ├── modules/ │ ├── init.py │ ├── csv_loader.py # Carga y normalización de archivos CSV │ ├── query_engine.py # Procesa preguntas y ejecuta consultas IA │ ├── styles/ │ └── theme.css # Estilos visuales personalizados │ └── venv/ # Entorno virtual (no se incluye en Git)

⚙️ Instalación y ejecución

1️⃣ Clonar el repositorio

git clone https://github.com/IreHurtado/data-assistant.git cd data-assistant

2️⃣ Crear un entorno virtual

python -m venv venv source venv/bin/activate # En Linux/Mac venv\Scripts\activate # En Windows

3️⃣ Instalar dependencias

pip install -r requirements.txt

4️⃣ Configurar la clave de OpenAI

Crea un archivo .env en la raíz del proyecto con tu API Key: OPENAI_API_KEY=tu_clave_aqui

5️⃣ Ejecutar la aplicación

streamlit run app.py

🧠 Ejemplos de uso

Una vez cargado tu CSV, puedes hacer preguntas como:

“¿Cuál fue el mes con mayores ingresos?”

“¿Qué producto generó más ganancias?”

“¿Cuál es el promedio de ventas?”

“¿Qué departamento tuvo más empleados?”

“¿Cuál es el total de ingresos del año?”

El sistema genera el código pandas correspondiente y lo ejecuta en tiempo real.

Desarrollado por Irene Hurtado Inspirado en la idea de crear un asistente de análisis de datos accesible y flexible para estudiantes y profesionales.

📜 Licencia

Este proyecto se distribuye bajo la licencia MIT. Eres libre de usarlo, modificarlo y compartirlo con atribución.

About

💡 An AI-powered Streamlit app that lets you analyze CSV files through natural language questions. 🧠 Automatically generates pandas code, validates your queries, and visualizes data instantly.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published