# UT1: Fundamentos y Ecosistema de la Ciencia de Datos con Python

Análisis de datos con Python

# UT1: El Detective de Datos

> **Cuaderno de trabajo — UT1: El Detective de Datos**
>
> Este notebook contiene los ejercicios de la unidad. Para la teoría
> completa consulta el libro (PDF).

**Manos a la Obra**

### Autoevaluación de las 8 Disciplinas

**Objetivo:** Identificar tus fortalezas y áreas de mejora en las 8
disciplinas.

**Instrucciones:**

1.  Para cada disciplina, puntúa tu nivel actual del 1 al 5 (1=ninguno,
    5=avanzado)
2.  Identifica las 2 disciplinas donde te sientes más fuerte
3.  Identifica las 2 disciplinas donde necesitas más trabajo

**Criterio de éxito:**

-   Tabla completada con 8 puntuaciones
-   Reflexión escrita de 3-4 líneas sobre tu perfil

**Tiempo estimado:** 10 minutos

``` python
# Escribe tu codigo aqui
```

**Manos a la Obra**

### Analiza un Caso de Éxito

**Objetivo:** Aplicar el pensamiento analítico a un caso real.

**Instrucciones:** Elige UNO de los casos anteriores (Moneyball,
Netflix, Fraude o Tinder) y responde:

1.  ¿Cuál era el **problema de negocio** original?
2.  ¿Qué **datos** se necesitaron para resolverlo?
3.  ¿Cuál fue el **insight clave** que cambió la situación?
4.  ¿Qué **métricas** se usaron para medir el éxito?
5.  ¿Cómo podrías aplicar un enfoque similar en **otro sector**?

**Criterio de éxito:**

-   Respuestas de 2-3 líneas para cada pregunta
-   Propuesta de aplicación a otro sector coherente

**Tiempo estimado:** 15 minutos

``` python
# Escribe tu codigo aqui
```

**Manos a la Obra**

### Mapea un Problema al Flujo de Trabajo

**Objetivo:** Practicar la descomposición de un problema real en las 6
fases del flujo.

**Escenario:** Trabajas en el departamento de marketing de una tienda
online de ropa. El director te dice: “Nuestros clientes compran una vez
y no vuelven. Quiero saber por qué y cómo mejorar la retención.”

**Instrucciones:** Para cada fase del flujo, describe qué harías:

1.  **Formular la Pregunta:** ¿Cuál es la pregunta específica que los
    datos pueden responder?
2.  **Obtener los Datos:** ¿Qué datos necesitas? ¿De dónde los sacarías?
3.  **Limpiar y Ordenar:** ¿Qué problemas de calidad podrías encontrar?
4.  **Explorar y Entender:** ¿Qué patrones buscarías?
5.  **Modelar:** ¿Sería útil un modelo predictivo? ¿Para qué?
6.  **Comunicar:** ¿Cómo presentarías los hallazgos al director?

**Criterio de éxito:**

-   Una respuesta de 2-3 líneas para cada fase
-   Las respuestas deben ser específicas para el escenario (no
    genéricas)

**Tiempo estimado:** 15 minutos

``` python
# Escribe tu codigo aqui
```

**Manos a la Obra**

### Tu primer notebook en Google Colab

**Objetivo:** Configurar tu entorno de trabajo y crear tu primer
notebook funcional.

**Instrucciones:**

1.  Abre Google Colab[1]

2.  Crea un nuevo notebook: Archivo → Nuevo cuaderno

3.  Renómbralo: “UT01_MiPrimerNotebook”

4.  Crea una celda de texto con:

    -   Un título con tu nombre
    -   Una lista de 3 cosas que esperas aprender en este módulo

5.  Crea una celda de código con:

    ``` python
    print("Hola, soy un analista de datos en formación!")
    2 + 2
    ```

6.  Ejecuta la celda con `Shift + Enter`

**Análisis de los resultados:** Este primer bloque confirma que tu
entorno de ejecución está activo. El mensaje impreso verifica que Python
responde correctamente, y el resultado `4` demuestra que Colab puede
realizar cálculos matemáticos inmediatos, funcionando como una
calculadora científica avanzada integrada en tu informe.

**Criterio de éxito:**

-   Notebook creado y renombrado correctamente
-   Celda de texto con título y lista formateados
-   Celda de código ejecutada mostrando el mensaje y el resultado 4

**Tiempo estimado:** 10 minutos

**Manos a la Obra**

### El arte de la documentación (Markdown)

**Objetivo:** Practicar la creación de documentación estructurada usando
Markdown.

**Instrucciones:** En una nueva celda de texto en tu notebook de Colab,
crea una “Ficha de Investigación” para el caso Moneyball que incluya:

1.  Un **título principal** (#)
2.  Un **subtítulo** (##) con el nombre del equipo
3.  Una **lista con viñetas** de los 3 descubrimientos clave
4.  Una palabra en **negrita** y otra en *cursiva*
5.  Un **enlace** a la página de Wikipedia de Billy Beane

**Criterio de éxito:**

-   Estructura jerárquica clara (títulos y subtítulos)
-   Lista correctamente formateada
-   Enlace funcional

**Tiempo estimado:** 10 minutos

``` python
# Escribe tu codigo aqui
```

[1] <https://colab.research.google.com>

In [6]:
from google.colab import drive
drive.mount('/content/drive')

In [7]:
# Leer un CSV desde Drive
import pandas as pd
df = pd.read_csv('/content/drive/MyDrive/datasets/mi_archivo.csv')

**Manos a la Obra**

### Configura tu entorno profesional

**Objetivo:** Montar Google Drive y cargar tu primer dataset (conjunto
de datos).

**Instrucciones:**

1.  Crea la estructura de carpetas en tu Google Drive (PYAD/datasets,
    notebooks, output)

2.  Descarga el dataset Titanic desde el repositorio del libro[1] y
    guárdalo en `datasets/`

3.  En tu notebook, monta Google Drive

4.  Carga el dataset con Pandas:

    ``` python
    import pandas as pd
    df = pd.read_csv('/content/drive/MyDrive/PYAD/datasets/titanic.csv')
    df.head()
    ```

5.  Ejecuta `df.info()` para ver información básica del dataset

**Análisis de los resultados:** Al ejecutar `df.head()`, has validado
visualmente que los datos se han leído correctamente desde Drive. Por
otro lado, la salida de `df.info()` es tu primer diagnóstico técnico:
confirma que tienes 891 registros y te revela qué columnas son numéricas
y cuáles de texto, además de detectar si faltan datos (valores nulos),
paso fundamental antes de cualquier análisis.

**Criterio de éxito:**

-   Estructura de carpetas creada en Drive
-   Dataset Titanic cargado correctamente
-   `df.head()` muestra las primeras 5 filas
-   `df.info()` muestra 891 filas y 12 columnas

**Tiempo estimado:** 15 minutos

[1] <https://raw.githubusercontent.com/jgarcia314/analisis-datos-python-fp/main/data/raw/titanic.csv>