# Las Fénix Sobre Ruedas
## 🐼 Organizando el Escuadrón con PandasMisión 02: Organizando el Escuadrón con Pandas

### 📝 **MEMORÁNDUM CONFIDENCIAL**


**PARA:** Nuestra Analista de Datos Estrella

**DE:** Isabel "La Centella" Montero, Entrenadora Principal, Las Fénix Sobre Ruedas

**ASUNTO:** Necesito Claridad en el Equipo... ¡Y Detectar Patrones!

Analista,

El trabajo con NumPy nos dio una primera visión de los números, pero ahora necesito que demos un paso más allá. Quiero que uses **Pandas** para organizar toda la información en una estructura clara, como una tabla de mandos. Esto nos permitirá ver no solo las cifras, sino también los nombres, las fechas, los comentarios... todo en su sitio. Pandas es una biblioteca de Python especializada en el manejo y análisis de estructuras de datos.

He estado revisando los informes preliminares y, aunque los números generales del equipo son aceptables, tengo la sensación de que hay **algunas dinámicas internas y rendimientos individuales que quiero que empecemos a observar con más detalle**. Es importante que te familiarices bien con las herramientas de selección y filtrado de Pandas.

**Tu misión con Pandas (el DataFrame ya estará cargado para ti):**
1.  **Inspección General:** Familiarízate con el DataFrame `df_fenix` que ya hemos cargado: dimensiones (`.shape`), información general (`.info()`), primeras/últimas filas (`.head()`, `.tail()`), nombres de columnas (`.columns`), tipos de datos (`.dtypes`).
2.  **Tipos de Datos Adecuados:** Asegúrate de que cada columna tenga el tipo de dato correcto. Presta especial atención a `Fecha_Sesion` (a `datetime`) y a las columnas numéricas que puedan estar como `object`. Límpialas y conviértelas a numéricas.
3.  **Selección de Columnas y Filas:** Practica la selección de datos usando los nombres de columna y los métodos `iloc` y `loc`.
4.  **Filtrado por Condiciones:** Realiza algunos filtros básicos para seleccionar sesiones que cumplan ciertos criterios.
5.  **Nuevas Perspectivas:** Crea la columna `Faltas_Totales`.
6.  **Análisis Enfocado (¡Aquí empieza lo interesante!):** Una vez te hayas familiarizado con lo anterior, quiero que apliques esas habilidades de filtrado para examinar más de cerca a "EstrellaFugaz77" y "NovaProdigy21". Compara sus puntuaciones medias en sesiones clave y revisa sus comentarios.
7.  **Informe de Inteligencia Pandas:** Al final, resume los pasos de limpieza y cualquier observación inicial, especialmente sobre esas dos patinadoras.

Tenemos que empezar a entender no solo *qué* pasa, sino a *quién* le pasa y *por qué*.

In [None]:
import pandas as pd
import numpy as np # Lo podríamos necesitar para np.nan o alguna conversión

# Configuración de Pandas
pd.set_option('display.max_columns', None)
pd.set_option('display.max_colwidth', None)
pd.set_option('display.float_format', lambda x: '%.2f' % x) # Formatear floats a 2 decimales

In [None]:
# ¡Atención Analista! La Centella te ha facilitado este primer paso.
# El DataFrame 'rendimiento_fenix.csv' ya está cargado para ti en la variable df_fenix.
# ¡Directo a la acción!

try:
    df_fenix = pd.read_csv('rendimiento_fenix.csv', sep=';') 
    print("DataFrame 'rendimiento_fenix.csv' cargado exitosamente en la variable 'df_fenix'.")
    print(f"Dimensiones: {df_fenix.shape[0]} filas y {df_fenix.shape[1]} columnas.") 
except FileNotFoundError:
    print("Error CRÍTICO: No se encontró el archivo 'rendimiento_fenix.csv'.")
    print("Asegúrate de haber ejecutado 'generador_csv_fenix_v2.py' (y renombrado si es necesario a 'rendimiento_fenix.csv') y que el archivo esté en la ubicación correcta.")
    df_fenix = pd.DataFrame() # Crear un DataFrame vacío para evitar errores si no se carga

### 🕵️‍♀️ Tarea 1: Inspección General del DataFrame ⚙️

Ahora que `df_fenix` está cargado, vamos a conocer nuestros datos.

"La Centella" quiere un vistazo general. Vamos a usar algunos métodos básicos de Pandas para entender la estructura y contenido de nuestro DataFrame.

**Tu tarea:**
* Muestra las primeras 3 filas.
* Muestra las últimas 3 filas.
* Obtén el nombre de las columnas
* Obtén información general del DataFrame (tipos de datos, nulos).
* Genera estadísticas descriptivas para las columnas numéricas.

### 🏷️ (Opcional) Tarea Adicional: Renombrado Estratégico de Columnas

Revisa los nombres de las columnas. Si alguna necesita un nombre más claro o práctico para trabajar, este es el momento de usar `.rename()`.

*Para este dataset, los nombres deberían ser bastante descriptivos. Realiza esta tarea solo si identificas alguna columna que se beneficiaría de un cambio.*

In [None]:
# Renombro la columna

------------------------------------------------------------------------------------------------------------------------------------------------------------------

`📝 **Documentación del ejercicio por parte de la alumna**📝:`

**
**

------------------------------------------------------------------------------------------------------------------------------------------------------------------

### 🔧 Tarea 2: Asegurando los Tipos de Datos Correctos

Es crucial que cada columna tenga el tipo de dato apropiado para poder realizar análisis correctos. Pandas es flexible y puede manejar una amplia variedad de formatos de datos [661].

- `Fecha_Sesion` debe ser de tipo `datetime`. (Es probable que con el batiburrillo que tenemos montado la funcion pd.to_datetime sin más no sea suficiente, pero puedes crear una función teniendo en cuenta esto:

        - Formatos_a_probar = [
                    '%Y-%m-%d %H:%M:%S',  # Formato estándar: '2024-08-27 19:00:00'
                    '%d-%b-%y',          # Formato clave: '16-Sep-24'
                    '%d/%m/%Y',          # Formato europeo: '17/09/2024'
                    '%B %d, %Y',         # Nombre de mes completo: 'September 03, 2024'
                ])
        - from pandas import Timestamp

- Columnas que deberían ser numéricas pero puedan estar como `object` (ej. `Duracion_Min`, `Pulsaciones_Max_BPM`, `Puntuacion_Rendimiento`, etc.) deben limpiarse (quitar caracteres no numéricos si es simple, como "bpm") y convertirse. Utiliza `pd.to_numeric(errors='coerce')` para manejar valores que no se puedan convertir, los cuales se transformarán en `NaN`.

In [None]:
# Convierto Fecha_Sesion en datetime (¿Pierdo muchisimos datos?)



In [None]:

# 4. 

# 5. 

# 6. 


In [None]:
# 

In [None]:
#

------------------------------------------------------------------------------------------------------------------------------------------------------------------

`📝 **Documentación del ejercicio por parte de la alumna**📝:`

**
**

------------------------------------------------------------------------------------------------------------------------------------------------------------------

### 🎯 Tarea 3: Selección de Columnas y Filas (`loc` e `iloc`)

Practicaremos cómo acceder a partes específicas de nuestro DataFrame. `loc` se usa para acceder por etiquetas y `iloc` por posición numérica.

**Instrucciones:**
1.  Selecciona y muestra solo la columna `Alias_Patinadora`. ¿Qué tipo de estructura de Pandas es?
2.  Selecciona y muestra las columnas `Alias_Patinadora`, `Fecha_Sesion` y `Puntuacion_Rendimiento`.
3.  Usando `iloc`:
    * .a Selecciona y muestra la tercera fila del DataFrame (índice 2).
    * .b Selecciona y muestra las filas en las posiciones 10 a 14 (inclusive la 14).
    * .c Selecciona y muestra las primeras 3 filas y las primeras 3 columnas.
4.  Usando `loc`:
    * .a Selecciona y muestra las filas con índice (etiqueta) de 0 a 5 (inclusive la 5).
    * .b Selecciona las filas con índice 0 a 5 y solo las columnas `Alias_Patinadora` y `Puntuacion_Rendimiento`.

In [None]:
# 1. 

In [None]:
# 2.

In [None]:
# 3.a


# 3.b


# 3.c



4.  Usando `loc`:
    * Selecciona y muestra las filas con índice (etiqueta) de 0 a 5 (inclusive la 5).
    * Selecciona las filas con índice 0 a 5 y solo las columnas `Alias_Patinadora` y `Puntuacion_Rendimiento`.

In [None]:
# 4.a


# 4.b 


------------------------------------------------------------------------------------------------------------------------------------------------------------------

`📝 **Documentación del ejercicio por parte de la alumna**📝:`

**
**

------------------------------------------------------------------------------------------------------------------------------------------------------------------

### 🚦 Tarea 4: Filtrado por Condiciones

Ahora seleccionaremos filas que cumplan criterios específicos. Esto es muy potente para aislar datos de interés.

**Instrucciones:**
1.  Crea un DataFrame `df_alto_rend` que contenga solo las sesiones donde `Puntuacion_Rendimiento` fue mayor a 8.0. Muestra las primeras 5 filas.
2.  Crea un DataFrame `df_descanso_bajo` con las sesiones donde `Horas_Sueño_Previas` fue menor a 6.5. Muestra las primeras 5 filas.
3.  Crea un DataFrame `df_cond_combinada` con sesiones donde `Puntuacion_Rendimiento` sea mayor a 7.5 **Y** `Horas_Sueño_Previas` sea mayor o igual a 7. Muestra cuántas sesiones cumplen esto y las primeras 3 filas. Utiliza los operadores lógicos `&` (and) y `|` (or) para combinar condiciones.

In [None]:
#1


In [None]:
#2


In [None]:
#3   

------------------------------------------------------------------------------------------------------------------------------------------------------------------

`📝 **Documentación del ejercicio por parte de la alumna**📝:`

**
**

------------------------------------------------------------------------------------------------------------------------------------------------------------------

### ✨ Tarea 5: Creando Nuevas Perspectivas

Crear nuevas columnas a partir de las existentes nos ayuda a enriquecer el análisis. Se pueden crear por asignación directa.

**Instrucciones:**
1.  Crea una nueva columna `Faltas_Totales` en `df_fenix` que sea la suma de `Numero_Caidas_Leves` y `Numero_Fallos_Tecnicos`.
    * Antes de sumar, asegúrate de que los NaNs en estas dos columnas se traten como 0 para la suma, para no propagar NaNs innecesariamente si una de las dos es NaN pero la otra no.
2.  Muestra las primeras filas de `df_fenix` con esta nueva columna y las columnas originales de faltas.

------------------------------------------------------------------------------------------------------------------------------------------------------------------

`📝 **Documentación del ejercicio por parte de la alumna**📝:`

**
**

------------------------------------------------------------------------------------------------------------------------------------------------------------------

### 🎯 Tarea 6: Análisis Enfocado en Patinadoras Clave - Primeras Pistas del "Salseo"

Ahora, aplicaremos nuestras habilidades de filtrado para examinar más de cerca a **"EstrellaFugaz77"** y **"NovaProdigy21"**, como nos pidió "La Centella".

**Instrucciones:**
1.  Filtra `df_fenix` para obtener todos los registros de "EstrellaFugaz77" y guárdalos en `df_estrella`.
2.  Sobre `df_estrella`, filtra las sesiones de `Tipo_Sesion` que sean "Simulacro Competición" o "Clasificatoria Interna". Calcula la `Puntuacion_Rendimiento` media de "EstrellaFugaz77" en estas sesiones.
3.  Repite los puntos 1 y 2 para "NovaProdigy21", guardando en `df_nova` y calculando su media.
4.  Compara las medias de ambas.
5.  Muestra algunos comentarios únicos (no nulos y no vacíos) de `Comentario_Patinadora` y `Comentario_Entrenadora` para "EstrellaFugaz77".
6.  Haz lo mismo para "NovaProdigy21".

In [None]:

#Analisis para Estrella Fugaz 77:


#Analisis para Nova Prodigy 21:


------------------------------------------------------------------------------------------------------------------------------------------------------------------

`📝 **Documentación del ejercicio por parte de la alumna**📝:`

**
**

------------------------------------------------------------------------------------------------------------------------------------------------------------------

### 📄 Tarea 7: Primer Informe de Inteligencia para "La Centella"

**Resumen de Limpieza y Transformación:**
* *(La alumna describe aquí los pasos clave: Carga del CSV `rendimiento_fenix.csv`. Realizada inspección general. Convertida la columna `Fecha_Sesion` a formato datetime. Columnas numéricas relevantes fueron procesadas para asegurar tipo numérico, manejando errores de conversión con `coerce`. Se creó la columna `Faltas_Totales`.)*

**Observaciones Iniciales sobre "EstrellaFugaz77" y "NovaProdigy21":**
* **Rendimiento Medio en Sesiones Clave (Simulacro Competición / Clasificatoria Interna):**
    * "EstrellaFugaz77": *(Poner la media de Puntuacion_Rendimiento calculada para ella)*
    * "NovaProdigy21": *(Poner la media de Puntuacion_Rendimiento calculada para ella)*
    * *Comentario de la alumna: ¿Hay una diferencia notable a simple vista? ¿Alguna es más consistente o con mejor rendimiento en estas sesiones de presión?*
* **Media de Faltas Totales (General):**
    * "EstrellaFugaz77": *(Poner la media de Faltas_Totales calculada para ella, si la alumna lo hizo o considera que puede hacerlo, no se ha solicitado con anterioridad)*
    * "NovaProdigy21": *(Poner la media de Faltas_Totales calculada para ella, si la alumna lo hizo o considera que puede hacerlo, no se ha solicitado con anterioridad)*
    * *Comentario de la alumna: ¿Alguna parece cometer significativamente más faltas?*
* **Comentarios Relevantes Encontrados:**
    * Para "EstrellaFugaz77": *(Mencionar 1-2 comentarios de la patinadora o entrenadora que hayan llamado la atención durante la exploración. Ej: "Se encontró el comentario 'Material no responde' y 'EF_Distraida' asociado a esta patinadora." o "No se encontraron comentarios particularmente alarmantes, pero sí algunos sobre 'presión'").*
    * Para "NovaProdigy21": *(Mencionar 1-2 comentarios. Ej: "Los comentarios de la entrenadora suelen ser positivos como 'NVA_Impecable', o son muy escuetos.").*
* **Próximas Preguntas/Sospechas para Investigar:**
    * *(La alumna podría plantear: La diferencia de rendimiento observada, ¿es estadísticamente significativa o podría ser casualidad? Los comentarios sobre el material de "EstrellaFugaz77", ¿coinciden con sus sesiones de menor puntuación o más faltas? ¿Hay algún patrón en las fechas o tipos de sesión donde "EstrellaFugaz77" parece tener más problemas o comentarios negativos? ¿Es "NovaProdigy21" tan consistente como parece, o hay algo más?)*


------------------------------------------------------------------------------------------------------------------------------------------------------------------

`📝 **Documentación del ejercicio por parte de la alumna**📝:`

**
**

------------------------------------------------------------------------------------------------------------------------------------------------------------------

### 💾 Guardado del DataFrame Procesado

Guardaremos nuestro DataFrame `df_fenix` (con la limpieza de tipos básicos y la nueva columna `Faltas_Totales`) para usarlo en el siguiente Notebook de EDA.

**Instrucción:**
* Guarda `df_fenix` como `rendimiento_fenix_pandas_limpio.csv`.

In [None]:
# Guardar el DataFrame para el siguiente notebook


### ✅ Misión 02: ¡Primeras Pistas y Datos Organizados! 🐼💪

¡Excelente trabajo con Pandas, analista!

Has organizado los datos de "Las Fénix" y, lo más importante, has empezado a tirar del hilo de algunas dinámicas que "La Centella" tenía entre ceja y ceja. 

Ahora ella puede:

* Ver un resumen claro del estado del equipo y los tipos de datos que manejamos.
* Seleccionar rápidamente la información de patinadoras o sesiones específicas usando `loc` e `iloc`.
* Filtrar datos para encontrar justo lo que necesita, incluyendo las primeras comparativas entre "EstrellaFugaz77" y "NovaProdigy21".
* Analizar nuevas métricas como `Faltas_Totales`.

Estos son los cimientos, y las primeras observaciones sobre nuestras patinadoras clave ya nos dan mucho en qué pensar. 

En la próxima misión (EDA), profundizaremos en estos patrones y buscaremos más respuestas.


🔥🔥🔥🔥🔥🔥🔥🔥🔥🔥🔥🔥🔥🔥