# Resumen de la clase: Uso de asistentes IA para diseño de analítica de datos

### **Ecosistema de Herramientas IA para Analítica**

Se presentaron dos tipos de herramientas principales:

- Gemini (en Colab): ideal para prototipado interactivo y generación de código/analítica.
- Google AI Studio:
  Link: [GoogleAIStudio](https://aistudio.google.com)
- Claude:
  Link: [Claude](https://claude.ai)
- Kimi:
  Link: [Kimi](https://kimi.moonshot.cn)
- Qwen:
  Link: [Qwen](https://chat.qwen.ai)
- DeepSeek:
  Link: [DeepSeek](https://chat.deepseek.com)

## Plataformas de benchmark para comparar modelos

A continuación se enumeran algunas plataformas y recursos útiles para comparar y evaluar modelos de IA, junto con recomendaciones prácticas para realizar benchmarks reproducibles:

- **Artificial Analysis** — https://artificialanalysis.ai
  - Plataforma web con comparativas y métricas de modelos de lenguaje y multimodales. Útil para obtener una visión rápida de rendimiento y comparativas públicas.
- **SVGBench (GitHub)** — https://github.com/johnbean393/SVGBench
  - Repositorio con scripts, datasets y ejemplos para pruebas de benchmark (ver README del proyecto para detalles sobre uso y ejemplos).
- **Aider** - https://aider.chat/docs/leaderboards
  - Plataforma para evaluar y comparar modelos de IA en tareas de programación.

### **Flujo de Trabajo Recomendado con Asistentes IA**

#### **Fase 1: Diseño Inicial y Brainstorming (Usando Gemini en Colab)**

Antes de escribir una sola línea de código, utiliza el asistente para definir la estrategia. Pega el siguiente prompt en la celda de texto del asistente en Colab, adaptando el contexto.

> **Prompt Maestro para Diseño Inicial:**
>
> `Actúa como un científico de datos senior. Mi objetivo es [describir el objetivo de negocio, ej: "predecir la tasa de cancelación de clientes"]. Te proporcionaré el esquema de mi dataset con las siguientes columnas: [lista de columnas con una breve descripción, ej: 'user_id', 'plan_type', 'monthly_spend', 'last_login_date'].`
>
> `Basado en esto, por favor, dame:`
> `1. Tres hipótesis de negocio que podríamos validar.`
> `2. Un plan de análisis paso a paso, desde la limpieza de datos hasta el modelado.`
> `3. Sugerencias de features (ingeniería de características) que podría crear a partir de las columnas existentes.`
> `4. Una lista de las visualizaciones más importantes que debería generar en el EDA.`

#### **Fase 2: Prototipado Acelerado (Usando Google AI Studio)**

Para una exploración rápida y generación de un notebook base.

1.  **Carga de Datos:** Arrastra tu dataset (CSV, etc.) o proporciona una URL a Google AI Studio para que lo reconozca.
2.  **Prompt de Exploración Automática:**
    > `Analiza el dataset adjunto. Actúa como un analista de datos y entrégame: 1. Un resumen estadístico y descriptivo de cada columna. 2. Una evaluación de la calidad de los datos, identificando valores nulos, anomalías o posibles inconsistencias. 3. Cinco recomendaciones de modelos de machine learning que podrían aplicarse, justificando por qué son adecuados para este problema.`
3.  **Prompt de Generación de Notebook:**
    > `Excelente. Ahora, crea un notebook de Python completo y reproducible en Google Colab que realice lo siguiente: 1. Carga del dataset. 2. Un Análisis Exploratorio de Datos (EDA) con al menos 3 visualizaciones clave y sus interpretaciones. 3. Pasos de preprocesamiento y limpieza de datos, explicando cada decisión. 4. Construcción de un modelo baseline (ej. Regresión Logística o RandomForest) con evaluación de métricas relevantes. 5. Comentarios detallados en cada celda explicando el código.`


### **Principios Fundamentales y Buenas Prácticas**

Para usar LLMs de forma efectiva y responsable:

*   **Principio de Especificidad:** Comienza con prompts claros, detallados y con contexto. Proporciona ejemplos del formato de entrada y salida que esperas.
*   **Iteración y Refinamiento:** No esperes el resultado perfecto a la primera. Pide al modelo que mejore su respuesta, que explique el código línea por línea o que añada validaciones.
*   **Verificación Humana (No Confianza Ciega):** Los modelos pueden "alucinar" e inventar funciones, librerías o conclusiones incorrectas. **Tú eres el responsable final.** Siempre ejecuta, valida y entiende el código generado.
*   **Trazabilidad y Reproducibilidad:** Guarda los prompts clave y las versiones del notebook (usando Git o el historial de Google Drive). Esto es crucial para entender cómo se llegó a una solución.
*   **Seguridad y Privacidad (Regla de Oro):** **Nunca** subas datos sensibles o de clientes a plataformas de IA públicas sin un proceso previo de anonimización y tokenización riguroso.

### **Conclusión y Próximos Pasos**

Los asistentes de IA no reemplazan al analista, sino que actúan como un **"copiloto"** que potencia su productividad, automatiza tareas repetitivas y libera tiempo para el pensamiento crítico y estratégico.

**Acciones recomendadas:**
1.  **Práctica Deliberada:** Elige un dataset de Kaggle o UCI y aplica el flujo de trabajo completo (diseño, prototipado, generación y validación).
2.  **Experimentación Comparativa:** Para un mismo problema, prueba los prompts en diferentes herramientas (Claude, Qwen, Gemini) y compara la calidad, estilo y precisión de sus respuestas.
3.  **Profundización:** Investiga técnicas de **"Prompt Engineering"** para mejorar la calidad de las respuestas que obtienes de los modelos.
