In [None]:
# Paso 1: Montar Google Drive
from google.colab import drive
drive.mount('/content/drive')

# Paso 2: Instalar nbconvert (normalmente ya está, pero por si acaso)
!pip install nbconvert

# Paso 3: Configurar rutas
import os
import glob
import subprocess

# Cambia esta ruta a la carpeta donde están tus notebooks
notebooks_folder = '/content/drive/MyDrive/Electiva-Analitica-IA'  # ⬅️ CAMBIA ESTO
output_folder = os.path.join(notebooks_folder, 'markdown')  # Carpeta para guardar los .md

# Crear carpeta de salida si no existe
os.makedirs(output_folder, exist_ok=True)

# Buscar todos los notebooks en la carpeta
notebook_files = glob.glob(os.path.join(notebooks_folder, "*.ipynb"))

print(f"Se encontraron {len(notebook_files)} notebooks. Convirtiendo a Markdown...")

# Convertir cada notebook
for notebook_path in notebook_files:
    filename = os.path.basename(notebook_path)
    md_filename = os.path.splitext(filename)[0] + '.md'
    output_path = os.path.join(output_folder, md_filename)

    # Usar jupyter nbconvert para convertir a markdown
    result = subprocess.run([
        'jupyter', 'nbconvert',
        '--to', 'markdown',
        '--output', output_path,
        notebook_path
    ], capture_output=True, text=True)

    if result.returncode == 0:
        print(f"✅ Convertido: {filename} → {md_filename}")
    else:
        print(f"❌ Error al convertir {filename}:")
        print(result.stderr)

Mounted at /content/drive
Se encontraron 3 notebooks. Convirtiendo a Markdown...
✅ Convertido: Clase2-Electiva-Analitica-IA.ipynb → Clase2-Electiva-Analitica-IA.md
✅ Convertido: Clase1-Electiva-Analitica-IA.ipynb → Clase1-Electiva-Analitica-IA.md
✅ Convertido: Convertir-MarkDown.ipynb → Convertir-MarkDown.md


### **Paso Final (Opcional pero Muy Recomendado): Convirtiendo al Asistente de IA en tu Socio Estratégico**

Hemos llegado muy lejos. Hemos preparado los datos, formulado preguntas y creado visualizaciones complejas para responderlas. Hemos actuado como analistas de datos.

Ahora, daremos un paso más allá y aprenderemos a usar la IA no solo como un generador de código, sino como un **consultor experto y un socio para la lluvia de ideas**.

En este ejercicio, le proporcionaremos a la IA todo el contexto de nuestro trabajo (las Clases 1 y 2) y le pediremos que actúe como un científico de datos senior que revisa nuestro proyecto. Le solicitaremos que nos dé:

1.  **Insights directos** sobre los datos que quizás no hemos visto.
2.  **Nuevas ideas y caminos** de análisis que podríamos explorar.
3.  **Formas alternativas** de escribir nuestro código, usando otras herramientas.
4.  **Recomendaciones de buenas prácticas** para mejorar nuestro flujo de trabajo.

Este es uno de los usos más poderosos de los LLMs en el análisis de datos: acelerar no solo la escritura de código, sino también la **generación de ideas y la calidad del análisis**.

**Instrucción:** Abre un nuevo chat con tu asistente de IA. Primero, copia y pega el contenido completo de los archivos `Clase1-Electiva-Analitica-IA.md` y `Clase2-Electiva-Analitica-IA.md` para darle todo el contexto. Inmediatamente después, sin añadir más texto, copia y pega el siguiente "Prompt Maestro".

### **Prompt Maestro (Para copiar en el nuevo chat después de los archivos markdown)**

> Actúa como un científico de datos senior y consultor experto. Acabas de revisar los dos notebooks (Clase 1 y Clase 2) que te he proporcionado, los cuales detallan un análisis exploratorio de datos sobre siniestros viales en Bogotá. Basándote en todo ese contexto, por favor, dame una revisión completa de este proyecto estructurada en los siguientes cuatro puntos:
>
> **1. Generación de Insights Directos:** Basado en los gráficos y tablas del análisis, ¿qué 3 a 5 conclusiones o insights clave puedes extraer? Resume los hallazgos más importantes como si los estuvieras presentando a un cliente.
>
> **2. Brainstorming y Rutas de Análisis Alternativas:** Nuestro análisis se centró en las hojas `SINIESTROS` y `ACTOR_VIAL`. Viendo el panorama completo (incluyendo las hojas `VEHICULOS` e `HIPOTESIS`), ¿qué nuevas preguntas de negocio podríamos responder? Sugiere al menos tres nuevas rutas de investigación que podrían generar valor.
>
> **3. Alternativas de Código y Bibliotecas:** Los gráficos se hicieron principalmente con `seaborn`. Para fines de aprendizaje, muéstrame cómo se podría haber creado uno de los gráficos simples, como el de "Distribución de Siniestros por Gravedad" (Paso 2, Clase 2), utilizando únicamente la biblioteca `matplotlib` (el "backend" de seaborn). Explica brevemente la diferencia en el enfoque.
>
> **4. Recomendaciones de Buenas Prácticas:** Revisando el flujo de trabajo general de los notebooks, ¿qué recomendaciones de buenas prácticas de programación y análisis de datos podrías dar para hacer el proyecto más robusto, eficiente y mantenible a futuro?

### **Ejemplo de una Respuesta Ideal del Asistente de IA**

¡Excelente trabajo en este análisis! He revisado a fondo los dos notebooks y el proyecto tiene una base muy sólida. Aquí tienes mi consultoría basada en los cuatro puntos que solicitaste:

#### **1. Insights Directos del Análisis**

Si tuviera que presentar los hallazgos clave a un cliente o a la alcaldía, me centraría en estos puntos:

*   **El Riesgo tiene Hora y Día:** La siniestralidad no es aleatoria. Se concentra masivamente en las horas pico de tráfico (7-8 a.m. y 5-7 p.m.), con un pico máximo sorprendente al mediodía (1-2 p.m.). Los viernes y sábados son, por mucho, los días más peligrosos.
*   **La Paradoja de la Gravedad:** Aunque la mayoría de los incidentes son solo daños materiales, esto no debe generar complacencia. Cuando ocurren fatalidades, el perfil de la víctima cambia drásticamente.
*   **Vulnerabilidad Extrema de Motociclistas y Peatones:** Este es el insight más crítico. En accidentes mortales, estos dos grupos constituyen la gran mayoría de las víctimas, muy por encima de los conductores de automóviles.
*   **Disparidad de Género en Fatalidades:** El análisis final revela un dato contundente: la inmensa mayoría de las víctimas mortales en todas las categorías de actores viales son hombres. Esto sugiere que los comportamientos de riesgo pueden tener un fuerte componente de género.

#### **2. Brainstorming y Rutas de Análisis Alternativas**

El análisis actual es excelente, pero podríamos profundizar mucho más utilizando los datos que aún no hemos tocado:

*   **Análisis Causa-Efecto (usando la hoja `HIPOTESIS`):** Podríamos responder: **"¿Cuál es la causa más común (ej. exceso de velocidad, no respetar señales) para los siniestros que involucran motociclistas?"**. Unir `df_completo` con la hoja `HIPOTESIS` nos permitiría pasar del "qué" al "**porqué**" de los accidentes.
*   **Análisis por Tipo de Vehículo (usando la hoja `VEHICULOS`):** Podríamos investigar: **"¿Los vehículos de servicio público están más involucrados en siniestros con heridos que los vehículos particulares?"**. Esto ayudaría a enfocar políticas de regulación y formación específicas para el transporte público o de carga.
*   **Análisis Geoespacial (usando la columna `DIRECCION`):** En la Clase 1 eliminamos la columna `DIRECCION` por su alta cardinalidad. ¡Pero podríamos recuperarla! Usando librerías como `geopandas` y `folium`, podríamos convertir las direcciones en coordenadas y crear un **mapa de calor** de Bogotá para visualizar los "puntos calientes" donde se concentran los accidentes mortales. Esto sería visualmente muy impactante y útil para la planificación urbana.

#### **3. Alternativas de Código: Matplotlib vs. Seaborn**

¡Claro! Seaborn es fantástica porque con una línea hace mucho (`countplot`). Matplotlib te da un control más granular, pero requiere más pasos. Así se vería el gráfico de "Distribución de Siniestros por Gravedad" solo con Matplotlib:

```python
# Preparación de los datos (la misma que para seaborn)
gravedad_counts = df_siniestros['GRAVEDAD'].value_counts()

# -- Código usando solo Matplotlib --
# 1. Crear la figura y los ejes
fig, ax = plt.subplots(figsize=(10, 6))

# 2. Crear el gráfico de barras explícitamente
ax.bar(x=gravedad_counts.index, height=gravedad_counts.values, color='steelblue')

# 3. Añadir títulos y etiquetas (muy similar)
ax.set_title('Distribución de Siniestros por Gravedad en Bogotá (Matplotlib)', fontsize=16)
ax.set_xlabel('Gravedad del Siniestro', fontsize=12)
ax.set_ylabel('Cantidad de Siniestros', fontsize=12)

# 4. Añadir una grilla para mejor lectura
ax.grid(axis='y', linestyle='--', alpha=0.7)

# 5. Mostrar el gráfico
plt.show()
```
**Diferencia de enfoque:** Con `seaborn`, le pasas el DataFrame y le dices "cuenta los valores en esta columna". Con `matplotlib`, tú primero debes calcular los valores (con `.value_counts()`) y luego le dices "dibuja estas barras con estas etiquetas y esta altura". Matplotlib es más explícito y personalizable, Seaborn es más rápido para gráficos estándar.

#### **4. Recomendaciones de Buenas Prácticas**

El flujo es muy bueno para un entorno educativo. Para llevarlo a un nivel de producción, recomendaría:

*   **Modularizar el Código con Funciones:** En lugar de repetir la lógica de mapeo para cada columna (`GRAVEDAD`, `CLASE`, etc.), se podría crear una única función `mapear_columna(df, nombre_columna, df_diccionario)`. Esto hace el código más limpio, reutilizable y fácil de depurar (DRY - Don't Repeat Yourself).
*   **Manejo de Errores Centralizado:** El código final que recarga los datos es una excelente práctica. En un proyecto más grande, esto iría en un script de "preparación de datos" que se ejecuta primero, y los análisis posteriores cargarían el dataset ya limpio y fusionado.
*   **Uso de Archivos de Configuración:** En lugar de tener la ruta a Google Drive escrita directamente en el código (`hardcodeada`), en un proyecto grande se usaría un archivo de configuración (ej. `config.yaml`) donde se guardan rutas y otros parámetros, haciendo el código más portable.
*   **Documentación (Docstrings):** A medida que se crean funciones, es una buena práctica añadir "docstrings" que expliquen qué hace la función, qué argumentos recibe y qué devuelve. Esto es invaluable para el trabajo en equipo y para tu "yo" del futuro.

¡Espero que esta revisión sea de gran ayuda! El proyecto tiene un potencial enorme y sigue una ruta lógica y muy profesional.