## 1️⃣ Extracción de datos

### Añadimos SRC a la raíz del proyecto para poder importar el contenido

In [2]:
import sys
import os

# Obtener la ruta absoluta de la carpeta raíz (donde está src)
ROOT_DIR = os.path.abspath(os.path.join(os.getcwd(), ".."))  # Subir un nivel desde notebooks/

# Agregar la carpeta src al path
sys.path.append(os.path.join(ROOT_DIR, "src"))

### 📌  Extraer Datos Detallados de Cada Pokémon

### Importamos todas las librerías

In [3]:
import pandas as pd
import time
from pokemon_api import get_pokemon_names, get_all_forms, get_pokemon_data, get_species_data, clean_pokemon_name
from data_processing import save_partial_data, filter_pokemon_variants
from config import PARTIAL_SAVE_PATH_DATA_COLLECTION, FINAL_SAVE_PATH_DATA_COLLECTION, FILTER_DATA_PATH, SORTED_FILTER_DATA_PATH, SORTED_FILTER_DATA_PATH_CLEANED, FINAL_DATASET_PATH

In [4]:
# Obtener lista de Pokémon
pokemon_list = get_pokemon_names()

# Obtener datos con variantes
pokemon_data = []
species_data = []

for i, p in enumerate(pokemon_list, 1):
    print(f"\n🔎 Obteniendo datos de: {p} ({i}/{len(pokemon_list)})")

    # Obtener todas las formas de un Pokémon
    all_forms = get_all_forms(p)
    
    for form in all_forms:
        poke_data = get_pokemon_data(form, i)  # Usa el ID base en todas sus variantes
        species_info = get_species_data(p)

        if poke_data and species_info:
            pokemon_data.append(poke_data)
            species_data.append(species_info)

    #time.sleep(1)  # Evita sobrecargar la API

    # Guardado parcial cada 50 Pokémon
    if i % 50 == 0:
        df_partial = pd.DataFrame(pokemon_data)
        df_partial.to_csv(f"{PARTIAL_SAVE_PATH_DATA_COLLECTION}/pokemon_partial_{i}.csv", index=False)
        print(f"📁 Guardado parcial en '{PARTIAL_SAVE_PATH_DATA_COLLECTION}/pokemon_partial_{i}.csv'")

# Convertir a DataFrame
df_pokemon = pd.DataFrame(pokemon_data)
df_species = pd.DataFrame(species_data)

# Fusionar datos
df_pokemon = pd.concat([df_pokemon, df_species], axis=1)

# Guardar el dataset final
df_pokemon.to_csv(f"{FINAL_SAVE_PATH_DATA_COLLECTION}", index=False)

print("✅ Dataset COMPLETO guardado correctamente.")




🔎 Obteniendo datos de: bulbasaur (1/1025)
✅ bulbasaur (Base: bulbasaur, Variante: None) -> grass / poison, HP: 45, Speed: 45
🔍 Intentando obtener especie de: bulbasaur (Base: bulbasaur)
🌐 Consultando API en: https://pokeapi.co/api/v2/pokemon-species/bulbasaur
✅ Especie encontrada para bulbasaur: Legendario: False, Mítico: False, Generación: generation-i

🔎 Obteniendo datos de: ivysaur (2/1025)
✅ ivysaur (Base: ivysaur, Variante: None) -> grass / poison, HP: 60, Speed: 60
🔍 Intentando obtener especie de: ivysaur (Base: ivysaur)
🌐 Consultando API en: https://pokeapi.co/api/v2/pokemon-species/ivysaur
✅ Especie encontrada para ivysaur: Legendario: False, Mítico: False, Generación: generation-i

🔎 Obteniendo datos de: venusaur (3/1025)
✅ venusaur (Base: venusaur, Variante: None) -> grass / poison, HP: 80, Speed: 80
🔍 Intentando obtener especie de: venusaur (Base: venusaur)
🌐 Consultando API en: https://pokeapi.co/api/v2/pokemon-species/venusaur
✅ Especie encontrada para venusaur: Legendari

KeyboardInterrupt: 

##  2️⃣ Explorar la Estructura del Dataset

### 📌 🔧 Limpieza de datos

##  3️⃣ Visualizar algunas Distribuciones

### Distribución de los tipos de Pokémon
✅ ¿Cuáles son los tipos más comunes en Pokémon?

### Relación entre las Estadísticas y la Popularidad

📌 ¿Qué veremos aquí?

✅ Si los Pokémon legendarios tienen stats mucho más altos.

✅ Si hay una relación entre ataque y defensa.

### ¿Los Pokémon legendarios tienen stats significativamente más altos?

📌 ¿Qué veremos aquí?

✅ Si los Pokémon legendarios tienen un total de stats mucho mayor.

✅ Si hay solapamiento entre legendarios y no legendarios.

### ¿Qué generaciones tienen más Pokémon legendarios?

📌 ¿Qué veremos aquí?

✅ Si hay generaciones con muchos más Pokémon legendarios que otras.

✅ Cómo ha evolucionado el diseño de Pokémon a lo largo del tiempo.

### ¿Cómo se distribuyen las estadísticas según el tipo de Pokémon?

📌 ¿Qué veremos aquí?

✅ Si ciertos tipos (como Dragón o Lucha) tienen mayor ataque en promedio.

✅ Qué tipos tienen menos poder ofensivo (Ej: Normal, Bicho, etc.).